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INTRODUCCION 


El Algebra lineal es una rama de las Matemáticas tan antigua 
como la propia Matemática. El problema de la solución de la ecua- 
ción lineal ax+b=0 puede ser considerado como el problema pri- 
mario del Algebra lineal. Aunque este problema no representa di- 
ficultad alguna, el método de su solución, así como las propiedades 
de la función lineal correspondiente y =ax+b, son los modelos de 
partida para las ideas y los métodos de toda el álgebra lineal. Por 
ejemplo, la teoria de la solución de un sistema de ecuaciones con 
varias incógnitas se basa en la idea de la sustitución del sistema 
dado por una cadena de ecuaciones del tipo indicado y de la forma 
más sencilla. 

La importancia de los sistemas de ecuaciones lineales aumentó 
particularmente con la creación de la Geometría analitica, que per- 
mitió reducir todos los problemas principales sobre la posición de 
pianos y rectas en el espacio al estudio de sistemas de ecuaciones 
lineales. Ya en el siglo XVIII la búsqueda de fórmulas generales 
para la solución de un sistema de n ecuaciones con n incógnitas 
llevó a Leibniz y a Cramer al concepto de determinante, En el 
siglo XIX, además del Algebra y de la Geometria analítica, los 
determinantes traron también en el Análisis con los trabajos de 
Ostrogradski, Jacobi (determinantes funcionales), Wronski y otros. 
Paralelamente en la Geometría analítica, en la teoría de los núme- 
ros y especialmente en la mecánica teórica adquiría cada vez mayor 
importancia el problema de transformación de formas cuadráticas 
mediante sustituciones lineales de las variables. Este problema re- 
sultó ser también uno de los centrales en el desarrollo de las ideas 
qna de Lobachevski y de Riemann, que llevó a la creación 
le la teoria de espacios lineales multidimensionales (Grassmann). 
A mediados del siglo pasado y en relación con el estudio de ál- 
ebras no conmutativas (Hamilton) apareció en los trabajos de Cay- 

y y de Sylvester el cálculo de matrices, que en el desarrollo 
posterior del Algebra lineal pasó a ocupar uno de los puestos prin- 
cipales. A finales del siglo XIX quedaron creados los capitulos 
principales del cálculo de matrices: Tema normal de una matriz de 
una transformación linea! (Jordan), divisores elementales (Weierstrass), 
pares de formas cuadráticas (Weierstrass, Kronecker), formas hermi- 
tianas (Hermite). El desarrollo de la geometría diferencial de espa- 
cios multidimensionales y de la teoría de transformaciones de for- 
mas algebraicas de órdenes superiores llevó, a finales del siglo 
XIX, a la creación del cálculo tensorial. 

En el siglo actual los métodos del Algebra lineal han encontrado 
amplia aplicación y han sido desarrollados en la teoría de anillos 
y módulos, en la teoría de representaciones de grupos, así como en 
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la teoría de espacios topológicos vectoriales y otros capítulos del 
Análisis funcional. Ya en las dos últimas décadas la teoría de de- 
sigualdades lineales y la teoría de espacios afines multidimensiona- 
les, estrechamente ligada a la primera, han ocupado uno de los 
lugares centrales en una rama tan conocida de la matemática apli- 
cada como es la teoría de operaciones. Gracias a ello los elementos 
de la teoría de espacios afines multidimensionales constituyen ahora 
un momento indispensable en la formación matemática de ingenie- 
ros y economistas. 

Én el Algebra lineal se estudian objetos de tres géneros: ma- 
trices, espacios y formas algebraicas. Las teorías de estos objetos 
están estrechamente vinculadas. La mayoría de los problemas del 
Algebra lineal admite un enunciado natural en términos de cada 
una de las tres teorías señaladas. El enunciado matricial es gene- 
ralmente el más cómodo para los fines de cálculo, Por otra parte, 
en la geometría y en la mecánica la mayoría de los problemas del 
Algebra lineal aparece como problemas de estudio de formas alge- 
braicas. Sin embargo, la comprensión más clara de las relaciones 
internas de diferentes problemas del Algebra lineal se alcanza so- 
lamente al considerar los espacios lineales correspondientes que son 
por ello el objeto principal de estudio en el Algebra lineal. 

Desde el punto de vista de la teoría de formas el contenido 
del Algebra lineal se descompone de modo natural en la teoría de 
formas lineales, cuadráticas y de órdenes superiores. El álgebra 
lineal propiamente dicha se relaciona, en general, solamente con la 
teoría de formas lineales y cuadráticas, así como con los elementos 
iniciales de la teoría de formas polilineales y del álgebra tensorial. 


Capítulo 1 Matrices 
y determinantes 


$ 1. Operaciones con matrices 


. Los objetos principales de es- 
ces, los espacios lineales y los 
polinomios de varias variables, llamados también formas algebraicas, 
En la definición de cada uno de estos objetos participa un conjunto K 
de números o elementos de otra índole que debe ser previamente 
elegido. La elección concreta de K depende de los problemas que 
se resuelven y de la disciplina científica. Por ejemplo, desde el 
punto de vista algebraico los resultados obtienen la forma más 
completa, si K es el conjunto de todos los números complejos. Por 
el contrario, en la geometría y en la mecánica es preciso considerar 
generalmente los números elos, mientras que en la teoría de los 
números resulta natural aceptar que K es el conjunto de los números 
racionales o, incluso, solamente el conjunto de los números racionales 
enteros. Para que los resultados puedan ser aplicados a un número 
de problemas lo más amplio posible conviene, por lo tanto, no fijar 
de antemano qué conjunto concreto se comprende por K. En algunas 
secciones será suficiente suponer que K es un anillo asociativo. 
En varios capítulos aceptaremos que K es un cuerpo conmutativo ar- 
bitrario o un cuerpo conmutativo arbitrario ordenado, mientras que 
varios teoremas importantes serán demostrados solamente en la supo- 
sición de que K es el conjunto de todos los números reales o el con- 
junto de todos los números complejos. Para las aplicaciones geomé- 
tricas y físicas son de mayor importancia precisamente los casos en 
que Kes el cuerpo de los números reales o el cuerpo de los números 
complejos. 

Los elementos del conjunto K se llamarán números incluso cuando 
K sea un anillo arbitrario. Los representaremos por letras griegas 
minúsculas œ, B, ..., T. 

Un sistema arbitrario de elementos del conjunto K dispuestos 
en forma de una tabla rectangular de m filas y de n columnas se 
denomina (m, n)-matriz o simplemente matriz sobre K. Para 
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representar una matriz, los símbolos que designan sus elementos suelen 
escribirse en el orden adecuado y la tabla obtenida se incluye entre 
aréntesis, corchetes o barras “verticales dobles. Por consiguiente, 
la forma general de una (m, n)-matriz será 


Qi he see Cig ¿Oy hs Qin Ci Gu Oin 
Qar Qag eee Oan Orn eg Qin (Cor Zez Zan 
Omi Oms +e Ama Omi Omg Amn Cur Amg ma 


donde œ; representan elementos de K. En vez de esta notación 
Eo ias con frecuencia se emplea la notación abreviada: ||œ;;|| o 
Ll, mo 

si el número de filas coincide con el número de columnas, la 
matriz se llama cuadrada y el número de sus filas, igual al de sus 
columnas, se llama orden de la matriz cuadrada. En particular, una 
matriz cuadrada de orden 1 es simple nente un elemento de K. 

Una matriz compuesta de una sla fila se llama simplemente 
fila y el número de sus elementos se denomina longitud de fila. 
En lo sucesivo las matrices serán representadas por letras mayús- 
culas latinas. 

Dos matrices se llaman iguales, si son iguales los números de 
sus filas y de sus columnas respectivamente y si coinciden los nú- 
meros que ocupan posiciones correspondientes en estas matrices. 
Por consiguiente, una igualdad entre dos (m, n)-matrices equivale a 
mn igualdades entre sus elementos. 

Las operaciones matriciales principales son: la multiplicación de 
un número por una matriz o de una matriz por un número, la 
adición y la multiplicación de dos matrices. Por definición, para 
multiplicar el número æ por la matriz A o la matriz A por el nú- 
mero a hay que multiplicar por œ todos los elementos de la ma- 
triz A. Por ejemplo, 


MES [3 au E "] =lis pee 
elit atan) [è iha- [ia he) 

Si las matrices se consideran sobre un anillo conmutativo K, es 
válida la igualdad «A=Aa para cualquier matriz A y para cual- 
quier «€ K. En el caso de un anillo no conmutativo K puede re- 
sultar que qA + Aa. Siendo K el anillo de todos los números 
enteros, tenemos, por ejemplo, 


2 8152 3] 5_[10 15 
5: E Al = i 31 es ES el 
La matriz, en la cual todos los elementos son iguales a cero, 
se llama matriz nula y se designa O. Si se quiere indicar de manera 


explícita el número de filas y de columnas de la matriz nula, se 
escribe Onn: 
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Está claro que para toda matriz A sobre K y para cualesquiera 
a, PEK tienen lugar las relaciones: 

i, 1-A=4-1=4. 

2. 0-A=4-0=0; a:0=0-9=0. 

3. a(BA)=(08) A; (Aa) f = A (aß). 

Se llama suma de dos matrices A y B de igual cantidad de 
filas y de columnas respectivamente una matriz con el mismo nú- 
mero de filas y de columnas, cuyos elementos son iguales a las 
sumas de los elementos correspondientes de las matrices A y B. 
Por ejemplo, 

2 13 02 —2 £ Fii 
E 3 J+ 2 — 1-E e] ol 

De esta definición se desprenden inmediatamente las relaciones: 

4. A+(B+C)=(A+ B)+C; 

5. A+B=B+4; 

6. (a+B)A=0aA4 BA; Ala 8)=A04+ AB; 

7. a(A+B)=0A+aB; (A4+B)a=4a4 Ba; 

8. A+0=0+A=A; 
la demostración queda a cargo del lector. En particular, empleando 
las propiedades 1 y 6, obtenemos 

AF A=24, AH AH A=34, ... 

Introduciendo la notación (—1) A=—A, tendremos también 
AH=4)=0, (—aJA=—aA, —(A+B)=—A—B, 
—(—A)=4. 

Para abreviar, en lugar de A-+-(—B) suele escribirse A— B. 
1.2, Multiplicación de matrices, A diferencia de las operaciones 


de adición y de multiplicación por un número, la operación de 
multiplicación de una matriz por otra se define de forma más com- 
pleja. A saber, sean dadas dos matrices A y B, tales que el número 
de columnas de la primera coincide con el número de filas de la 
segunda. Si 


En Be e E Bu as s Be 
A=|%n n +- On | y Bjón Bu Pap 
SE 0005 Ti Bm Ba >< Pap 


la matriz 
Ya Ya 
=¡Yn Ye 


Cm 
b Yas +e. Yo 
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donde ie 


hpv 


a P ay +8 að +pa ae +py 
E Al e -|E adt Pan Soi 


awt BA 004 Bu aet Bav, 


La regla de multiplicación de matrices se enuncia, a veces, de la 
siguiente forma: para obtener el elemento, que se encuentra en la 
iésima fila y j-ésima columna del producto de dos matrices, hay que 
multiplicar los elementos de la i-ésima fila de la primera matriz por 
los elementos correspondientes de la ¡-ésima columna de la segunda 
matriz y sumar los productos obtenidos. 

Et producto de dos matrices, hablando en términos generales, 
depende del orden de los factores incluso en el caso en que el anillo 
K es conmutativo. Por ejemplo, 


Lt 21 f1 2 34 
3. aru TALE 84 
1 2].f1 2 76 
E j= 4 4): 

Si se consideran matrices no cuadradas, puede ocurrir incluso 
que el producto de dos matrices tomadas en un orden tenga sentido 
y tomadas en el orden contrario, no lo tenga. 

Demostremos ahora las propiedades principales de la multipli- 


cación de matrices. 
9. a(AB)=(9A)B; A(aB)=(4a)B; (4B)a=A(Ba). 


Sean A =|] æjllnn y B =|| By llap: Para el elemento que se encuen- 
tra en la ima fila y k-ésima columna de la matriz «(AB) 
(ima, i k=l, ..., p), obtenemos, empleando la regla de 


multiplicación de matrices, la expresión siguiente: 


aabt. +2:nBnr). 

Análogamente, para el elemento que se encuentra en la misma 
iésima fila y en la misma k-ésima columna de la matriz (a.4) B, 
obtenemos la expresión 

(Ai) Bret > > + H (Ain) Bare- 


Como ambas expresiones coinciden, queda demostrada la primera 
de las igualdades 9. Con cálculos semejantes se demuestran las otras 
dos igualdades de 9, así como las propiedades: 


10. (A+B)C=AC+BC. 
11. C(4A+8)=CA+CB. 
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De las propiedades 10 y 11 se desprende directamente la siguien- 
te regla general: para multiplicar una suma de matrices por otra 
hay que multiplicar cada matriz de la primera suma por cada matriz 
de la segunda suma y sumar los productos obtenidos. 

Hemos visto que para el producto de matrices no se cumple la 
ley conmutativa: AB puede ser distinto de BA. Sin embargo, la 
segunda ley aritmética—la ley asociativa de la multiplicación —se 
cumple para la multiplicación de matrices”. 

12. A(BC)=(AB)C. 

Para la demostración tomemos 

AB=M y BC=N 


y representemos mediante f y vy los elementos de las matrices 
M y N. Según la regla de multiplicación de matrices tenemos 


Hir AaB t ABar t E Ainars 
Va = Bu H Baut HBo Yo 


donde djn Pje Y va son tos elementos de las matrices A, B y C. 
Efectuando la multiplicación de M por C, obtendremos en la ¡-ésima 
fila y Pésima columna de la matriz (AB)C la suma 


BaYu dia Ha NA ar 
TT 


Análogamente, efectuando la multiplicación de A por N, obtendremos 
en la iésima fila y l-ésima columna del producto A (BC) la suma 


NV Vat E ina =D Aa 
FE 


Puesto que estas dos sumas difieren solamente en el orden de los 
sumandos, la fórmula 12 queda demostrada. 

De la fórmula 12 se deduce que el producto de varias matrices 
dispuestas en un orden determinado no depende de cómo se colo- 
uen los paréntesis. Por esto podemos hablar no sólo sobre el pro- 
ducto de dos matrices, sino también sobre el producto de un número 
mayor de matrices. Por ejemplo, podemos hablar simplemente del 
producto ABCD de cuatro matrices, ya que las cinco formas dife- 
rentes de calcular este producto 


((AB)CID, (A(BC)D, A((BC)D), A(B(CD), (AB)(CD) 


llevan al mismo resultado. En efecto, cada producto siguiente se 
obtiene del anterior aplicando directamente la ley asociativa 12. 


DPuesto que no se pueden sumar y multiplicar matrices arbitrarias, sino 
solamente aquellas en las que el número de filas y de columnas está sujeto a 
condiciones determinadas, las igualdades 10, il y 12 deben comprenderse de 
manera que si las operaciones indicadas en uno de los miembros son posibles, 
las operaciones indicadas en el otro miembro también son posibles y los resul- 
tados obtenidos en ambos miembros coinciden. 


2—1843 
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Ya hemos señalado que cualesquiera dos matrices no pueden ser 
sumadas o multiplicadas, ya que para poder realizar estas operacio- 
nes es preciso que se cumplan determinadas relaciones entre los. 
números de filas y de columnas. Este inconveniente desaparece si 
se consideran solamente matrices cuadradas de un orden fijo n. 
Cualesquiera dos matrices de este tipo pueden ser sumadas o multi 
plicadas, así como multiplicadas por cualesquiera números de K, 
y el resultado será otra vez una matriz cuadrada del mismo orden n, 
Las propiedades 1—12 indican que el conjunto de todas las matrices 
cuadradas de orden dado n sobre un anillo asociativo arbitrario K 
forman, a su vez, un anillo asociativo respecto a las operaciones 
matriciales de adición y de multiplicación. 

En lo que sigue aceptaremos que el conjunto numérico principal 
K es un anillo asociativo con el elemento unidad 1. La matriz 
cuadrada, en la que todos los elementos diagonales son iguales a 1 
y los restantes son iguales a cero, se denomina matriz unidad y se 
designa mediante £ o E, donde n es su orden. Por consiguiente, 


0 


Efectuando el cálculo directo, es fácil obtener para cualquier matriz 
cuadrada A la igualdad 
AE=EA=A, 


que expresa la propiedad fundamental de la matriz E. Las matrices 
de tipo 


a 0 o 
ob o 
oo y 


se denominan diagonales. 

De las reglas para las operaciones se desprende directamente que 
la suma y el producto de matrices diagonales son también matrices 
diagonales: 


e Do mw € 
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a coo 07 e OS co DR a ÓN O 
DP ab je Bi: is O |- 0 PB... 0 
UM es ALO O e ALE Y md 


Consideremos ahora una matriz cuadrada cualquiera X de orden 
n formada por elementos del anillo K. Por definición, tomamos 


X'=E, X'=X, X’aXX, X’=XXX,... 
Puesto que en los produclos de varias matrices los paréntesis 
pueden ser dispuestos arbitrariamente, tenemos para cualesquiera 


enteros no negativos p y q y para cualquier matriz cuadrada X 
sobre el anillo asociativo K 


XIXI = Xr+, w 
(Xy = (2) 
Las matrices A y B se llaman conmutables, si 
AB=BA. (3 
De la relación (1) obtenemos 
XIXI = XP += X0XP, 


y, por consiguiente, todas las potencias naturales de una misma 
matriz son conmutables entre si. 

Es válida incluso una afirmación más general: sí las matrices 
A y B son conmutables, cualesquiera potencias naturales de las mis- 
mas lambién son conmutables y para cualquier p natural se tiene 


(AB)? = APB. (4) 
En efecto, para cualesquiera naturales p y q se tiene 
APBIZ AA... AB... B. 


Por hipótesis, en este producto pueden ser permutados cualesquiera 
dos factores contiguos. Pero mediante permutaciones de este tipo 
los factores pueden ser dispuestos en cualquier orden y, en parti- 
cular, todos los factores iguales a B pueden ser llevados a las 
posiciones primeras. Análogamente se demuestra también la fór- 
mula (4). 

Consideremos ahora un polinomio 


A o 


en la letra A, cuyos coeficientes pertenecen al anillo K. Si A es 
una matriz cuadrada sobre K, la expresión 


Eta, At.. +40 A” 
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se denomina valor del polinomio p(A) para =A o, brevemente, 
polinomio correspondiente en la matriz A. Suponiendo que el anillo 
K es conmutativo, llegamos fácilmente a la conclusión de que el 
valor de una suma de polinomios en 2 para à= A es igual a la suma 
de los valores de los sumandos y de que el valor de un producto de 


polinomios, es igual al producto de los valores de los factores. 
an 


PA= tai n and”, 
PA =B HBA Bni 
Entonces, 
FA =p AH p A) =(% t Bo) + (a, ABDA H- -H (tnt Ba) A", 
EMN =p A pA) =02B H (AB HBA + HB rd. 
Nuestras afirmaciones consisten en que 
F(A) =p (4) +4 (A), 
g(A)=9 (A) PA). 


Para la demostración es suficiente escribir las expresiones para 

(4), HA) f(A) y g(A) y siguiendo las reglas 1—12 del cálculo 

matricial efectuar la adición y la multiplicación de p(4) y (A). 
A título de ejemplo consideremos la igualdad 


P—I=4—D(+1. 


Tomando los valores del primero y segundo miembro para À = A, 
obtenemos la igualdad matricial 


4—E=(A—EMA+E). 
De manera análoga de la igualdad 
W+1=0+1)02—4+1) 
obtenemos la relación 
A+E=(A+E)(A*—A +E). 


En general, de esta forma se puede obtener de toda relación entre 
polinomios en 2 una identidad matricial. En particular, según las 
reglas de operaciones con polinomios, se tiene 


PANPA = M0). 
Tomando aquí en lugar de A una matriz cuadrada A, obtenemos 
PAYA) =v 409 (A). 


Por consiguiente, los polinomios en una misma matriz son conmu- 
tables. 
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1.3. Transposición de matrices. Consideremos una matriz arbi- 
traria 


Ly An an 
On Gn San 
La, "na 
La matriz 
Ly An se Qa 
Q Qn c Om 
Qin Asn -ee Zan, e 


que se obtiene de A al cambiar las filas por las columnas, se llama 
transpuesta respecto de A. En lo sucesivo la raya siempre indicará 
el paso a la matriz transpuesta. 
Para dos matrices arbitrarias A y B tienen lugar las siguientes 
reglas de transposición: 
(A+ PB! =aA' +BB", 
(ABY =B'A', 


donde œ FA P son números cualesquiera. Demostremos, por ejemplo, 
la segunda de estas igualdades. El elemento, que se encuentra en 
la iésima fila y j-ésima columna de la matriz (AB)', es igual al 
elemento que aparece en la ¡-ésima fila e i-ésima columna de la 
matriz AB, es decir, es igual a 


Abt HB 
donde æ; y Biy son los elementos de las matrices A y B. Pero esta 
expresión es la suma de los productos de los elementos de la ¿-ésima 
fila de la matriz B’ por los elementos correspondientes de la ¡-ésima 
columna de la matriz A’; es decir, (ABY = B'A'. 
Si A es una matriz cuadrada cualquiera y 


Ama, 
se dice que A es simétrica; en cambio, si 
AmA, 


se dice que A es antisimétrica. Los elementos simétricos respecto 
de la diagonal principal coinciden en una matriz simétrica y son 
opuestos en una matriz antisimétrica. “En particular, todos los ele- 
mentos diagonales de una matriz antisimétrica son iguales a cero. 

De la regla de transposición de una suma se deduce directamente 
que la suma de matrices simétricas es una matriz simétrica y que 
la suma de matrices antisimétricas es una matriz antisimétrica. El 
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producto de matrices simétricas puede no ser una matriz simétrica; 


por ejemplo, 

129 (2.17 fp 3 

2 s'i UI sr > 
Sin embargo, si dos matrices simétricas A y B son conmutables, 
el producto también será una matriz simétrica. En efecto, en este 


caso se tiene 
{ABY = B'A’ = BA = AB. 


De aquí se deduce que las potencias de una matriz simétrica son 
matrices simétricas y que los polinomios en una matriz simétrica 
también son matrices simétricas. 

Una matriz cuadrada A sobre el anillo K se llama invertible 
(sobre K), si existe una matriz cuadrada X sobre K, que satisface 
las relaciones 


AX=XA=E. a) 


Toda matriz X que verifica las condiciones (1) se denomina 
matriz inversa de A o inversión de la matriz A. Para toda matriz 
invertible A existe solamente una inversión. En efecto, si además 
de la matriz X hay otra matriz Y que satisface las condiciones (1), 
multiplicando a la izquierda por X ambos miembros de la igualdad 


AY=E, 
obtenemos 
XA-Y =XE 
oY=X. 
La inversión de la matriz A, si es que existe, se designa me- 
diante A=!, Es decir, por definición, 
A- A-= A- AcE. 2) 
En las condiciones (1) Jas matrices A y X figuran simétrica- 
mente y, por ello, si X es la inversión de A, A es la inversión 
de X; en otras palabras, 
(ä-)- = A. (3) 


Si Jas matrices cuadradas A, B y C son de un mismo orden e 
invertibles, su producto ABC también es invertible y 

(ABC) =C=2B="4=, 
es decir, la inversión de un producto de matrices es igual al pro- 


ducto de las inversiones de los factores tomado en el orden contrario. 
Para la demostración es preciso comprobar las igualdades 


ABC.CABAA=C-B="41.ABC=E, 
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que son consecuencias evidentes de las relaciones (2) y de las rela- 
ciones análogas para las matrices B y C. 

Para toda matriz invertible A, además de sus potencias natu- 
rales AP=E, A'=A, A®=AA, ..., se consideran también sus 
potencias negativas enteras, tomando por definición 

A= ATAT, AS ATACA, a) 


Las potencias fraccionarias de matrices se consideran raramente, 
debido a que en muchos casos las definiciones corrientes no ofrecen 
valores univocos para estas potencias (véase el p. 16.2 del cap. IV). 

De las relaciones (2) y (4) se deduce que para cualquier matriz 
invertible A y cualesquiera números enteros (no necesariamente po- 
sitivos) p y q tienen lugar las reglas comunes de operaciones con 
potencias 

APAI = Ar*9, 
(Ary = Ara, 
además, si las matrices A y B son invertibles y AB=BA, se 
iene 
(ABY = 4PBr. 
Veamos ahora la relación que existe entre las operaciones de 


transposición e inversión. Aplicando a las relaciones (1) la regla de 
transposición del producto de matrices, obtenemos 


X'A'=A'X' =E, 


es decir, al transponer una matriz invertible A se obtiene de nuevo 
una matriz invertible y 


(A't = (ATI. (5) 
Una matriz cuadrada A se llama ortogonal, si 
AA'=A'AsE, (6) 


es decir, si la matriz transpuesta es inversa de la inicial. De aqui 
se deduce, en particular, que toda matriz ortogonal es invertible. 
Puesto que (A') =A, de (6) se deduce que la inversión de una 
matriz ortogonal es una matriz ortogonal. 
Además, si las matrices A y B son ortogonales, se tiene 


ARAS, BB" 
y, por consiguiente, 
(AB! = B'A’ = B~A-' = (ABy-*. 
En otras palabras, el producto de matrices ortogonales es una 
matriz ortogonal. 


Consideremos una operación matricial más. Sea A una matriz 
arbitraria, cuyos elementos son números complejos. Sustituyamos 
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en A todo elemento por el múmero complejo conjugado. La matriz 
obtenida por este procedimiento se llama conjugada compleja de A 


y se designa por Á. La operación consistente en el paso a la matriz 
conjugada compleja posee las propiedades siguientes: 
cAFPBB=24+PB, 

AB=AB, 
F =(AY, 

A= (A); 
la demostración es muy sencilla y queda a cargo del lector. 

Las matrices A y A" se denominan conjugadas según Hermite). 

Si A=A', la matriz A se llama hermitiana o simétrica según Her- 
na matriz A que satisface la relación 


Ñ'A=AÑ' =E, 


se llama unitaria. 

Se puede demostrar, por el mismo procedimiento que el empleado 
para las matrices ortogonales, que la matriz inversa de una matriz 
unitaria es unitaria y que el producto de matrices unitarias es tam- 
bién una matriz unitaria. 

Si todos los elementos de la matriz A son números reales, se 
tiene Á=A y, por consiguiente, para las matrices reales los con- 
ceptos de simetría y de simetría según Hermite, así como los de 
matriz unitaria y de matriz ortogonal, coinciden. 


1.4. Matrices celulares. Dividamos una matriz A en partes me- 
diante un sistema de rectas verticales y horizontales. Estas partes 
pueden ser consideradas como matrices de órdenes inferiores que 
forman, interpretadas como elementos, la propia matriz; se deno- 
minan células, cajas o bloques de la matriz A, mientras que la propia 
matriz A, dividida de un modo determinado en células, se deno- 
mina, respectivamente, celular, de caja o de bloque. Una misma 
matriz puede ser dividida en células de diferentes maneras; por 


ejemplo: 
1 87 6 1 8 76 1 87 6 
3 50 2], |: 5 a E 50 zl 
1 493 17493 1493 


La conveniencia de la divi en células consiste en que las 
operaciones principales sobre matrices celulares se realizan formal- 
mente siguiendo las mismas reglas que en el caso de matrices co- 


1) En el capitulo V estas matrices se llaman también conjugadas transpuestas 
o anticonjugadas (N. del T7.) 
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rrientes. En efecto, supongamos una matriz A dividida de algún modo 
en células: 


Al multiplicar todas las células por un número œ multiplicaremos, 
al mismo tiempo, todos los elementos de la matriz A por a. Por 


consiguiente, 
GAn Am... OA 
aAml.-.... an... A 
han GAm +... AA, 


Sea B una matriz dividida en el mismo número de células que 
la matriz A: 


Supongamos, además, que las correspondientes células de las matri- 
ces A y B son del mismo número de filas y de columnas respecti- 
vamente. 

Para sumar las matrices A y B hay que sumar, según la defi- 
nición, sus elementos correspondientes. Pero lo mismo ocurrirá, si 
sumamos las células correspondientes de estas matrices. Por esto 


AntBua AntBa - AmtBin 
A+8=|. . % 


AmtBa Amt Bas <> Annt Ban 


La situación es menos evidente en el caso de la multiplicación. 
Consideremos las matrices 


divididas en células U,, y V de manera que el número de colum- 
nas de la célula U sea igual al número de filas de la cólula 
Valis l, sm; 1=43...,1 kel, ..., p). En estas condiciones 
143 expresiones 


Wi=0V + UV ++ + UV nr 
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tienen sentido. Es fácil demostrar que 


[Ei sas Wiz 
a: o 
w, w, 


™m mp. 


es decir, las matrices divididas de manera adecuada en células pue- 
den ser multiplicadas de la forma corriente: las células del producto 
son iguales a las sumas de los productos de las células de las filas 
de U por las células correspondientes de las columnas de V. 


Demostremos primero esta regla en el siguiente caso particular: 
1481 [5] =4c +50. @ 


elementos de las matrices A, B, C y D respectiva: 
mente (t= n; k=l, ..., S lesl, ..., 1). Efectuando las 
operaciones indicadas en el 'pri to de la igualdad (2), obtendremos que 
el elemento que se halla en la i-ésima fila y /-ésima columna es igual a 


QaYt -eH tinn H B ndut -H Bidse 


Por otra parte, calculando el elemento correspondiente del segundo miembro, 
obtendremos lá misma expresión y, por consiguiente, la igualdad (2) queda de: 
mostrada. 

Empleando la fórmula (2), es fácil demostrar ahora una fórmula más genera! 


Sean EU ¿Bio vn y, A k 


MA, 


=A8:+ 418,4. AnBn ía) 
Èn, 
donde A; y Bj son células. Para n=2 esta fórmula coincide con (2). Apliquemos 


deducido pongamos que para, os valores de z menores que un valor dado 
la fórmula (3) ha si femostrada y sea 


Ba 
CxlAs ... Ash Dej : |. 
Ba 


En este caso de (2) obtenemos 


B, 
B; 
Marda +++ Anl | $? [14,01 [B] =410,+00=4181+410++-..+ An. 
b, 
De manera análoga se obtienen las fórmulas 
Alı B, ... Ba]=(4B, AB, ... ABp), 4) 
2,4 
[Bm] il, 45) 
Án Lins 


Para deducir ahora de las fórmulas ¡particulares (3. (4) y (5) 1a fórmula general (1), 
designemos mediante Uy, +... Ua las lilas de células de la matriz U y mediante 


$ 1. Operaciones con matrices 27 


Va, ..., Vp las columnas de células de la matriz V. En base a la fórmula (5) 


tenemos 
VA UNA 
uv -Í : ] v= [ : 
Ùn Uny. 


Tomando aqul en lugar de la matriz V su división en células [Va ... Vp) y em- 


pleando la fórmula (4), obtenemos 

UW: ..- UN, 
w-[ RE DAA Ae Ti. © 

UaVs .. UnVo, 

Por otra parte, en virtud de (3) tenemos 
Vig 

UVa=lUp + Uil | + [EUV oH UV nm Wi 

Vas 


Colocando estas expresiones en (6), obtendremos la fórmula (1). 


En el caso de matrices cuadradas resulta necesario, como regla 
general, dividirlas de manera que las células diagonales también 
sean cuadradas. Es fácil ver que, divididas dos matrices cuadradas 
en células de manera que las células diagonales sean cuadradas 
y que los ordenes de las células diagonales correspondientes coinci- 
dan, esta división satisface tanto las condiciones en las que es po- 
sible la adición célula por célula, como las condiciones que son 
necesarias para poder multiplicarlas como matrices celulares. 

Toda matriz celular de tipo 


CA, 0 o 
A Ja 
lo o A.) 


donde Aj, A, son células cuadradas y O son matrices nulas 
de dimensiones adecuadas, se llama matriz celular diagonal. En el 
mismo sentido se dice también que A se descompone en partes 
Aj, ..., As o que A es la suma directa de las matrices Ay, ..., A. 
simbólicamente 


E 
AAA + HA 
Las operaciones con matrices descompuestas se reducen a las 


operaciones con sus células diagonales. De aquí, a su vez, se des- 
prende que siendo f (å) un polinomio y A una matriz celular 
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diagonal de células diagonales A,, ..., Aj, se tiene 
CHA) 7 
HA) 
HA = b à Y) 
A "HAD 


1.5. Cuaternios. Las matrices constituyen un instrumento có- 
modo mediante el cual se pueden construir a partir de un anillo 
dado, por ejemplo, del anillo de los números reales, anillos de 
estructura más compleja. De forma sistemática este problema se 
estudia en la teoría de anillos y nos vamos a limitar a considerar 
solamente dos casos particulares. 

Consideremos el anillo R, de todas las matrices cuadradas de 
segundo orden sobre el cuerpo R de los números reales. Tomemos 


10 0 —i 
e=[5 a e 1=|? 3) 
Sea C el conjunto de todas las matrices de R, de tipo 
«E+B =| =] (a. BER). w 


Elevando al cuadrado la matriz /, obtenemos /*=—E y por ello 
las operaciones con las matrices (1) se pueden efectuar” siguiendo 
las fórmulas 


(aE +B/) + (YE +81) = (a + y) E +(B + ô) 1, 

(QE + BI) (YE + 61) = (ay — pô) E + (a8 + By) 7, 
es decir, las mismas fórmulas que para los números complejos æ- Bi 
y v-+5i. De las fórmulas señaladas se deduce también que el con- 
junto de matrices C es un anillo y que la correspondencia 

aE+P!— a+ Bi 

es una aplicación isomoría del anillo C sobre el anillo de todos los 
números complejos. 


A partir de las matrices de segundo orden E e / construimos 
ahora cuatro matrices cuadradas de orden 4: 


(52. (273. 10 3) (28. o 


La matriz e es la matriz unidad corriente de orden 4 y, por 
ello, 


el=ú 


i e=ie=j h=ke=k (8) 
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Multiplicando las matrices (2) según las reglas de multiplicación 
de matrices celulares y teniendo en cuenta que /*=—E, obtenemos 


—ik (4) 


ij=k=— ji, ¡k=i=—kj, ki= 
y. además, 


Paaka e. (5) 


Es fácil memorizar las fórmulas (4): significan que en la se- 
cuencia i, j, k, i, j, k el producto de dos elementos consecutivos 
es igual al elemento que les sigue. 

Las matrices de tipo 


da 
cc+i4yj+se=|P _% ta, © 
ô Br aj 


donde œ, P, y, Ô son números reales arbitrarios, se llaman cua- 
ternios (o, a veces, matrices cuaternios). De (6) se deduce que la 
representación de los cuaternios en la forma ac-+Bi- yj- Ó% es 
unívoca. En otras palabras, la relación 


aet Bi+yj + ök=met+ pity + ôk 
equivale a cuatro igualdades: 


a=%, B=b, y=y ô=ô,. 


La adición y la sustracción de los cuaternios, representados 
en la forma algebraica normal ae-+Bi-+yj -+ ôk, se realiza por la 
regla corriente: 


(ue + Bi + y] + ök) + (ae + Bri+ y] + 6,4) = 
=(a + a)e+ (Br P) i+ t 1) /+(6+ 6,)h. (7) 


Para multiplicar dos cuaternios, representados en la forma 
algebraica normal, es suficiente recurrir a la ley distributiva y a 
las tablas de multiplicación (3), (4) y (5). Como resultado llegamos 
a la fórmula 


(ae + Bt -+ vj + ôk) (0104 Brit) -+ Ô,k) = 
= (aa, — PP, — Yy, —88,) e+ (aB, + Ba, + y5, —Óy a) i + 
+ (ay, + va +08, —B8) ¡+ (a8, +60, + By, — vB) k. (8) 


Las fórmulas (7) y (8) muestran que el conjunto Q de los 
cuaternios matriciales es un anillo con unidad e, que constituye 
un subanillo del anillo de todas las matrices reales de orden 4. 
Los cuaternios e, i, j y k suelen llamarse cuaternios unidades. De 
las relaciones (4) 'se deduce que el anillo de los cuaternios es no 
conmutativo. El hecho más notable consiste en que el anillo de 
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los cuaternios es un cuerpo, es decir, que en el anillo de los cua- 
ternios pueden ser resueltas todas las ecuaciones de tipo 


ax=b, ya=b, (9) 


donde a y b son cualesquiera dos cuaternios dados, de los cuales a 
es diferente de cero. Más abajo se dan unas fórmulas cómodas 
para la solución de estas ecuaciones. 

Consideremos un cuaternio cualquiera 


q=ae + Bi+ yj + ôk. 
El número real 

Napo 
se llama norma del cuaternio q. Puesto que a, B, y y 8 son núme- 
ros reales, la norma de un cuaternio es un número real no negativo 


e igual a cero sólo para el cuaternio nulo. 
El cuaternio 


q =ae—Pi—yi —6k 
se denomina conjugado de q. Es ciaro que q*=q. Mediante la 
multiplicación directa de los cuaternios q y q* (según la fór- 
mula (8) se obtienen las igualdades principales 


9g =q9=N (9)-e, 


de donde 

erg t= (10) 
o 

ar (1) 


(siempre que q +0). 
Volvamos ahora a las ecuaciones (9). Multiplicándolas por a~’, 
la primera por la izquierda y la segunda por la derecha, obtenemos 


x=a™b, y=ba". (12) 


Con la sustitución de estos valores en las ecuaciones (9) se demues- 
tra que las fórmulas (12) ofrecen efectivamente las soluciones 
buscadas de estas ecuaciones. 

En el caso general las soluciones a”!b y ba”! son distintas. Por 
esto suelen llamarse cocientes por la izquierda y por la derecha 
de b por a, designándose mediante aN b y b/a, respectivamente. 
Efectuando el cálculo directo, es fácil demostrar las fórmulas 


(aa Bb) = aa" + Bb", 
(aby = ba", 


Ejemplos y problemas a 


` de donde es fácil deducir la importante relación 
N(ab)=N (a) N (b) (a, bEQ). 
En efecto, 
N (ab)-e=abb*a* =aa*N (b) = N (a) N (b)-e. 
La aplicación œ—az es un isomorfismo del cuerpo (conmuta- 
tivo) de los números reales en el cuerpo de los cuaternios. Esto 
permite identificar un cuaternio de tipo «e con el número a y en 


lugar de ae+Bi+y/+ôk escribir simplemente a+ Bi- yi- 6%. 
Así, por ejemplo, se tiene 


E E A 


La mayor parte de los resultados de las secciones siguientes 
del libro estará relacionada con objetos cuya definición depende 
de un cuerpo K dado de antemano. Aunque tendrán interés princi- 
pal los casos en que K es un cuerpo conmutativo, los razonamien- 
tos se realizarán de manera que no quede excluido el caso de 
cuerpos no conmutativos. Al analizar estos razonamientos conviene 
tener en cuenta que el cuerpo K puede ser precisamente el cuerpo 
de los cuaternios Q. 


Ejemplos y problemas 
1. Sean 
12 
PM)=—2—54 43% y a=[, i] ; 
“2 
ea): 

2. Demuéstrese que la matriz 

v 04 

lio 

es unitaria. ¿Bajo qué condiciones una matriz diagonal resulta ser ortogonal? 


¿unitaria? 
3, Hállese la inversa de la matriz 


eri 
aefa is]. 
2 


la 
Mio 

a=jo 1 r| 
Lo 0 


, Lar 
AOL a . 
3 


Leo 1 


entonces 


se tiene 
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5. Demuéstrese que todas las matrices conmutables con 
fo1oo0 
0010 
0001 
0000 


A= 


son de tipo 
Faf yon 
0aPy 
0048 
0004) 
6. Si una matriz posee dos de las tres propiedades siguientes: es real, es 
ortogonal, es unitaria, posee también la tercera, 
in 10da matriz cuadrada, puede ser representada como la suma de una ma- 
triz simétrica y otra antisimétei 
Una matriz / se lla 
matriz posee dos de las proj 


Posee también la tercera. 
9. Una matriz P se llama idempofente, si Pte=P. Demuéstrese que las 


matrices 
—26 —18 277 100 
| 2a 15 ayfer] 
2 8 183 L000, 
son idempotentes. 


10. SÍ P es idempotente, lo matriz 
I=2P—E 
es Involutiva y viceversa, si / es involutiva, la matriz 


B= 


involutiva, si 1?=E. Demuéstrese que si una 
jades: es simétrica, es ortogonal, es involutiva. 


1 
Pq (+E) 


es Idempotente. 

11. Consideremos las matrices cuadradas de orden n. Sea Fy (i, J=1, ..., 
n) la matriz en la que el elemento de la ¡-ésima fila y j«ésima columna cs 
igual a 1. mientras que los demás elementos son iguales a 0. En estas condi- 
clones, para A= (1%, se tiene 


ALEy=0y Ey. +0 Enp 
Ey A=ap Ent. +0j0E in 


Dedúzcase de aquí que la matriz A es conmutable con cada una de las 
matrices Eyy si, y sólo si, A es de la forma aE. 

Empledndo este resultado, demuéstrese que la matriz A es conmutable con 
una matriz cualquiera cuadrada de orden n si, y sólo si, A =aẸ, donde a es 
un elemento del anillo principal K conmutabie con cualquier elemento de K. 

12. A veces, además de matrices de orden finito, se consideran también 
matrices de orden infinito que tienen la forma de una tabla infinita de dos 
entradas: < 


ES 
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Una matriz de este tipo se llama finita en fila, si cada una de sus filas 
contiene solamente un número finito de elementos diferentes de cero. Las opera- 
ciones con las matrices finitas en fila (así como con las matrices finitas en 
columna, que se definen análogamente) se realizan siguiendo las mismas reglas 
que tienen lugar en el caso de matrices cuadradas de orden finito. Es fácil ver 
que el resultado es de muevo una matriz finita en fila. 

Sca A=I|0;,I| una matriz de orden infinito tal que 1 
y ttsp=0 para 15 5 |. Demuéstrese que AA'=E y A'A # E. 


an=. 
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2.1. Definición. El concepto de determinante surgió en relación 
con el problema de solución de sistemas de ecuaciones lineales. 
Tomemos un cuerpo conmutativo K y consideremos sistemas ele- 
mentales de ecuaciones de primer grado de dos y tres incógnitas 
y con coeficientes de K. Un sistema de dos ecuaciones lineales con 
dos incógnitas E, y E. se representa en la forma siguiente: 


angi +a = Ba 
anki + anbe = fe (O 
donde œ; y P; son números de K dados. Las matrices 
afan an afon an Pi 
asiaa] y el 


se llaman matriz principal y matriz ampliada, respectivamente, del 
sistema (1). Con el fin de eliminar la incógnita E,, multipliquemos 
la primera ecuación por œ, y la segunda por —@, y sumemos 
ambas. Obtendremos la ecuación 


(Cry ga — Arataa) Es = Braa — Pao 


Si 0,1% — an 70, obtenemos de esta ecuación y de una ecua- 
ción análoga que se obtiene eliminando E, 
E 2 — aBa E, = Subi — anb 2) 
1 Attan 7 Aarma * 


Los denominadores de las expresiones de las incógnitas E, y E, 
coinciden y representan un polinomio en los elementos de la ma 
principal A. El valor de este polinomio se llama deferminante de 
la matriz A y se designa det A o | A|. Si la matriz viene dada 
por su tabla, el determinante se designa escribiendo la tabla entre 
barras verticales. 

Es decir, por definición para cualquier matriz cuadrada de orden 
dos se tiene 


Bl =0a5— 
31843 [sl Al i 
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Empleando los determinantes, Ja fórmula (2) puede ser escrita 


en la forma í i 
i ie au Bi 
selka, a [AL 
[en anl [55 
Resolviendo de forma análoga el sistema de tres ecuaciones 
anë, + has = Bas 
Anë, + Anë H as Bar (5) 
ais H aaa + as = Ba 
con tres incógnitas $, E, y E, obtenemos 
gp = Laaa Brasa + Beca — Bos + Patas — Batata (a 
1 Apaga An Azaga F aaa — Aa ag F Asa a — 1 29 


y unas expresiones análogas para E, y E,. Por supuesto estas expre- 
siones tienen sentido sólo en el caso en que su denominador sea 
diferente de cero. Las matrices 


A Aya Asy y Ls o Pa 
A= |an On Ga | y B=[% Cs as Ba 
Lay Qar ay ar Aaa aa Ba 


también se llaman matriz principal y matriz ampliada del sistema 
de ecuaciones (5). El denominador de la fórmula (6) se llama de- 
terminante de la matriz cuadrada A de orden tres. Luego, por de- 
finición, 


(4) 


A Qis Qis 
Oa Oas Osa 
Ayi Ryg Asg 


= yg — 


¡Lazos F ya Ly — pay lag 
Ey gg — yaaa (7) 


Uniendo en el segundo miembro los términos que contienen œ, 
Uy Y %, y recordando la fórmula (3), obtenemos 


Gi An Mia 
Oas as ra 


=0, dc ar Ara 
Lor Lar ga 


- (8) 
as Asy ar as 


a a 
+o[ 2 da 


Es fácil memorizar la fórmula (8). Para abreviar, en lugar de 
determinante de una matriz de orden dos o tres suele decirse deter- 
minante de segundo o tercer orden. Los tres determinantes de segun- 
do orden de la fórmula (8) se obtienen suprimiendo del determi- 
nante del orden tres, que figura en la misma fórmula, la primera 
fila y, respectivamente, la primera, la segunda y la tercera columna. 
A continuación, el determinante de segundo orden que se obtiene 
suprimiendo la primera fila y la ¡-ésima columna debe ser multi- 
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plicado por el elemento que se halla en la primera fila y en la j-ési- 
ma columna y los productos obtenidos deben ser tomados con signos 
alternos y sumados. Como resultado obtendremos el determinante de 
orden tres. 

Esta regla nos sugiere la idea de cómo debe ser definido el con- 
cepto de determinante de una matriz cuadrada de orden cuatro, 
cinco y de órdenes superiores. Por lo tanto, introducimos la sigui- 
ente definición principal: 

DEFINICIÓN. Se llama determinante de una matriz de primer or- 
den, formada por el número a, el propio número œ. Supongamos 
ahora que para un número natural cualquiera n > 1 conocemos ya el 
elemento del anillo K que representa el determinante de una matriz 
arbitraria cuadrada de orden n sobre K. Entonces, para una matriz 
cuadrada arbitraria A=||«,|| de orden n +1 sobre K tomamos, por 
definición, 


det [oy ll =æ] AL 1 Aila A e HI, aal A, 
(9) 


donde | Af] es el valor del determinante de la matriz de orden n que 
se obtiene de la matriz inicial A suprimiendo la primera fila y la 
j-ésima columna (i=1, ..., n+1). 

Aplicando esta definición en el caso en que n=1, obtenemos 
la fórmula (3) para determinantes de orden dos. Conociendo la ex- 
presión para los determinantes de orden dos, pooma, emplear 
la definición principal para obtener la expresión (8) para los deter- 
minantes de orden tres. De la expresión (8) obtenemos mediante (3) 
la fórmula definitiva (7). 

Veamos ahora cuál es la fórmula definitiva para los determi- 
nantes de orden cuatro. De acuerdo con la definición principal, el 
determinante de una matriz cuadrada arbitraria A=||a,,l| de orden 
cuatro coincide con la expresión 


Oar as a Oat og Ara Oor Oas ag 
Orf Oaa Aay gs |— a [gr Cas Aas |H Arafa Osr y, 
Qis Asg ag Aar Oas Qag a 
Qan Or Qy: 
— Qn |As Aas Azs (10) 
An as aa 


Introduciendo aquí las expresiones de los determinantes de orden 
tres según la fórmula (7) y suprimiendo los paréntesis, obtendremos 
la fórmula definitiva que buscabamos para un determinante de 
orden cuatro. No la escribiremos puesto que no tiene sentido memo- 
rizarla, Según (7) todo determinante de tercer orden es igual a la 
suma de seis términos tomados con signos alternados. Por eso, si 


za 
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tomamos en (10) en lugar de los determinantes de orden tres sus 
expresiones y suprimimos los paréntesis, obtendremos en total 4.6 = 24 
términos. La mitad de ellos aparecerá con el signo más y la otra 
mitad con el signo menos. Una afirmación análoga es válida también 
para los determinantes de orden cualquiera. 

TEOREMA 1 Para una matriz cuadrada arbitraria se tiene 


«> Oun 


donde la suma se extiende a las permutaciones arbitrarias (i,, iy... iy 
de los números 1, 2, ..., n. El signo más o menos se toma según 
sea par o impar la permutación (i, im ..., i,), es decir. en la 
mitad. de los casos se toma el signo más y en la otra mitad se toma 
el pero menos; a número total de términos en la suma (11) es igual 
a1:2.....nenl. 

Para 1, 2, 3, 4 la veracidad del teorema ya ha sido com- 
probada. Ahora aplicamos la inducción. Supongamos que el teorema 
es cierto para los determinantes de un orden cualquiera n y sea 
As=||a,,I] una matriz cuadrada de orden n-+ 1. Por hipótesis, cada 
de serminante: 141l (=1, ..., n41) de la fórmula (9) es de la 
jorma: 


= D E ariniy- > Coto (10 


lAl D E pm, Lam: > -Oat 1. mus (12) 


donde la suma se extiende a todas las permutaciones (m, ..., m,) 
de los números 1, ..., J—1, f+1, ..., n+1. El número de tér- 
minos en la suma (12) es igual a n!. Sustituyendo en (9) | 4Í] por 
sus expresiones y suprimiendo los paréntesis, obtendremos un total 
de nl(n+1)=(1-+ 1)! términos. La mitad de ellos tendrá el signo 
más y la otra mitad el signo menos. No habrá términos semejan- 
tes, puesto que los términos que se obtienen al suprimir distintos 
paréntesis difieren en el primer factor. Es evidente que el término 
arbitrario de tipo %5/%;,. . .%n+1.1n., Se obtiene al suprimir los pur 
réntesis en el producto æ, | Af | y, por consiguiente, la fórmula (11) 
es verídica. 

De la fórmula (11) se puede deducir fácilmente el siguiente 
corolario importante. Supongamos que los elementos de la matriz 
A=[la,,I] son números complejos. En virtud de la fórmula (11), 


tenemos 
[Ale B ta -oann Ea. aan =/41, 


es decir, 
141=[AT 


Según la fórmula (11) el valor del determinante de una matriz 
es igual a una suma algebraica de términos, cada uno de los cuales 
es el producto de elementos, tomados de manera que haya uno de 
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cada fila y uno de cada columna. Por ello, si todos los elementos 
de una fila o de una columna de la matriz son iguales a cero, tam- 
bién serán iguales a cero todos los términos del determinante. Es 
decir, hemos obtenido el siguiente corolario: 

COROLARIO. Si una fila o una columna de una matriz cuadrada 
está compuesta integramente por ceros, su determinante es igual a cero, 

Una matriz cuadrada se llama semidescompuesta, si sus elemen- 
tos pueden ser divididos mediante una línea vertical y otra hori- 
zontal en cuatro matrices de manera que a lo largo de la diagonal 
figuren matrices cuadradas y una de las otras dos matrices esté 
compuesta integramente por ceros. En otras palabras, la matriz A 
es semidescompuesta si tiene una de las dos formas siguientes 


Pay oee Qir Qr, paa Qin 
an rr Qr, phi 
0 Qrin r > 
00.0. O Anr 
Fow ss Mie 0 w Y 
Be”. wo. Ke o 0 
Apana ee renr pa o Gesn, n 
L Amo coe On Ompa cee Om 


A veces, la primera de estas matrices suele llamarse matriz se- 
midescompuesta superior y la segunda, matriz semidescompuesta 
inferior. 

TEOREMA 2. El determinante de una matriz semidescompuesta es 
igual al producto de los determinantes de sus células diagonales. 

Para una matriz de orden dos esta proposición es evidente, ya que 


a B]_Ja0 
165 ]=[55]=os. 

Apliquemos ahora la inducción aceptando que el teorema 2 es 
cierto para las matrices de un orden cualquiera n—1. Consideremos 
una matriz arbitraria semidescompuesta A de orden ». Supongamos 
que es de la forma D 

B 
A= la] l 
te =[8, € 


donde B y C son matrices cuadradas de orden r y s respectiva- 
mente (r+s=n) mientras que O,, y D son matrices rectangulares 
y la matriz O,, es mula. Aplicando la fórmula (9), obtenemos 


14I=05 1 Ao AA+. (Dan tl, (13) 
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donde | 47] es la matriz de orden n—1 que se obtiene suprimiendo 
en A la primera fila y la ¡-ésima columna. Es fácil ver que todas 
las matrices A% son semidescompuestas y, por cilo, según la supo- 
sición inductiva, el determinante de cada una de ellas es igual al 
producto de los determinantes de las células diagonales. Pero las 
matrices Al, Af_y las matrices A¡*, ..., Af se descomponen 
de modos distintos. Para las primeras tenemos 


14 =/BL LIC) i=l ....r (a 


mientras que las matrices A(**, A? pueden ser divididas me- 
diante una tinea vertical y otra horizontal de manera que el cu 
drado superior de la izquierda sea de orden r. Puesto que la úl- 
tima fila de este cuadrado está compuesta de ceros, su delerminan- 
te es igual a cero, El determinante de la matriz Af'* es igual al 
producto del determinante del cuadrado indicado por el determi- 
nante del cuadrado complementario. Luego, | A£*|=0 y, por con- 
siguiente, 


lA l= an| Bic]... +(—1)=10,, 1811: 1C]= 
=(an|Bi]—..- +a 181)-1C1=1B]:1C) (15) 


que es lo que queriamos demostrar. El caso en que la matriz A es 
de la forma 


a=lani=[5 %]. 


es aun más sencillo, ya que ahora se tiene œ, ,,, = 
y por esto de (13) y (14) obtenemos inmediatamente (15). 

TEOREMA 3 Si en las matrices cuadradas A=||a,,| y B=] Byll 
de un mismo orden n coinciden todos los elementos correspondientes 
menos los elementos de una fila i-ésima «cualquiera, se tiene 


d 
Qa eee Ou) fan 


an |+| Ba 


an 


(16) 


Omi +o Oml fm 


Este teorema suele llamarse a veces teorema de adición de de- 
terminantes. Pasando a su demostración, designemos mediante C la 
matriz del segundo miembro de la igualdad (16). Para matrices de 
primer orden la igualdad (16) es evidente. Aplicando la inducción, 
supongamos que para matrices de orden n—1 el teorema 3 es 
cierto. Si en la fórmula (16) ¿=1, desarrollando el determinante 
de la matriz C según la fórmula (9), obtenemos 


IC|= (an HBa Cil... +(1)%* (00 +B10) 101]. 
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Es evidente que Cį = A{= Bf y, por consiguiente, se tiene 


lCl= (eul AL... +10, 1 ATD 
+ (Bal Bill... +(—1B,,181)=/41+181. 


Supongamos ahora que en la fórmula (16) í> 1. Entonces, se 


tiene 
[Ci=a4/Ci=... (1 n CRN a7) 


Las matrices Ct, ..., C} son de orden n—1 y por esto para 
ellas es válido el desarrollo de tipo (16). Como resultado, obtenemos 


ICJ=] A+B] ((=1,.... 1) 


y, en virtud de la relación (17), tenemos |C|=|A]+18]. 

Desde el punto de vista formal, la definición principal de deter- 
minante sirve también para matrices formadas por elementos de un 
anillo asociativo K cualquiera (no necesariamente conmutativo). 
En la demostración de los teoremas 1, 2 y 3 tampoco se ha empleado 
la conmutatividad de K. Sin embargo, una serie de propiedades de 
los determinantes, de importancia para las aplicaciones, dependen 
de la conmutatividad del anillo principal K. Una de estas propie- 
dades se indica en el siguiente teorema. 

TEOREMA 4. Sea A una matriz cuadrada formada por elementos 
de un anillo conmutativo K. Si se multiplican todos los elementos 
de una fila de la matriz A por un elemento AEK, el determinante 
de la matriz también se multiplicará por à. En ótras palabras, se 
tiene 


La demostración se realiza igual que en el teorema anterior y 
no la vamos a repetir, Señalemos solamente el siguiente corolario 
importante: 

coroLario. Para cualquier matriz cuadrada A de urden n formada 
por elementos de un anillo conmutativo K y para cualquier AE K 


se tiene 
1P4]=3*| A]. 


En efecto, al multiplicar la matriz A por A, cada una de sus n 
filas se multiplicará por A. Por consiguiente, el determinante de la 
matriz A se multiplicará por A“. 

2.2. Propiedades principales de los determinantes. Consideremos 
una matriz cuadrada arbitraria A=||2,,[| de orden n formada por 
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elementos de un anillo cualquiera K. Según la definición principal, 
se tiene 


lAl=an | Ail tl A+. 4 (19001 47, 0) 


donde Af es la matriz que se obtiene de A suprimiendo la primera 
fila y la j-ésima columna. Aplicando ahora al determinante de la 
matriz Af la misma fórmula, obtenemos 


1Al=020 1 Atl... HH 0, y l AN 

HI a, jua Afa + (Gm 1 Az l, (2 
donde Af es la matriz que se obtiene de A suprimiendo la primera 
y la segunda filas y la j-ésima y la k-ésima columnas (j 4k). 


Introduzcamos en la fórmula (1) en lugar de los valores | 4/| 
sus valores (2). Como resultado, llegamos a la relación 


lAl= Dt aanl AÑ]. (3 


Aquí la suma se extiende a todos los pares posibles j, k de dife- 
rentes números, pertenecientes al conjunto 1, ..., n y el signo más 
o menos se toma de acuerdo con las fórmulas (1) y (2). Las matri- 
ces A/A y Alí coinciden evidentemente y, por lo tanto, la fórmula 
(3) puede ser representada en la forma siguiente: 


1Al= 2 (20% +2%,%)14%1. (4) 
Za 


Calculemos ahora con mayor exactitud cuáles son los signos que 
deben tomarse en la última fórmula. En virtud de (2), para el 
j-ésimo término de (1) tenemos 


y ayl A=... 1/90, a) Algld 


Análogamente y teniendo en cuenta que j < k, obtenemos para 
el k-ésimo término de (1) 


(AA aul Al + (A a (1 a ARH 


Por consiguiente, el coeficiente del término | A$] de la fórmula 
(4) es igual a 


(IVE (ny — anap ) = (1A a| a 
Arja 


y, en consecuencia, 
14]= Y, (yen 


jzk 


Zuta] at 6 
a E (5) 


La fórmula (5) se denomina desarrollo del determinante según 
los elementos de la primera y segunda filas. Es fácil memorizarla: 
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se toman todos los determinantes pusibles de orden dos formados por 
los elementos que se hallan en la primera y segunda filas y en las 
columnas j-ésima y k-ésima (1 < k) y se multiplican por los determi- 
nantes de las matrices correspondientes que se obtienen al suprimir 
en la matriz A las filas y columnas indicadas. Los productos se 
multiplican además por (—1y***1*2, donde el exponente es igual a 
la suma de los números que corresponden a las filas y a las colum- 
nas suprimidas, y después se suman. La suma algebraica así obtenida 
es igual al determinante de la matriz dada. 

Reglas semejantes tienen lugar también para los desarrollos según 
las tres primeras, las cuatro primeras, etc. filas. Pero en lo sucesivo 
no las necesitaremos. 

Emplearemos ahora la fórmula (5) para deducir una serie de 
propiedades principales de los determinantes. En lo que sigue se 
supone que los elementos de las matrices consideradas se toman de 
un anillo conmutativo K. 

TEOREMA 1. Si en una matriz cuadrada se cambian entre sí dos 
Filas cualesquiera, el determinante de la matriz nueva será igual al 
determinante de la matriz inicial tomado con el signo menos. 

Para matrices de segundo orden esta proposición se comprueba 
directamente: 


[FÉ]<as—0r [2.8] =9—82=-(00—pv. 


A continuación, suponemos por inducción que el teorema es justo 
para las matrices de orden n—1 y q la matriz dada A=||0,,|| 
es de orden n. Supongamos que en Á se cambian entre sí las dos 
primeras filas. De la fórmula (5) vemos que todos los determinantes 
de orden dos cambian de Signo, mientras que los factores adiciona- 
les no varían. Luego, toda la Suma adquiere el factor —1 que es 
lo que queríamos demostrar. 

Consideremos el caso en el que se cambian entre sí la ¡-ésima 
y la k-ésima filas, donde 1< j< k. Entonces, la primera fila per- 
manece invariable y del desarrollo (1) deducimos que cada factor 
| 41] obtendrá después del intercambio el valor opuesto; por ello, 
toda la suma obtendrá después del intercambio de las filas el valor 
opuesto. 

Finalmente, supongamos que se cambian entre sı la primera y 
la i-ésima fila, donde ¿>2. Este mismo resultado obtendremos si 
cambiamos entre sí primero la primera y la segunda filas, luego 
la segunda y la ¡-ésima y, finalmente, la segunda y la primera. 
Según hemos demostrado el determinante cambiará cada vez de 
signo y después de los tres cambios el determinante se multiplicará 


coroLarto 1. El determinante de una matriz cuadrada en la que 
coinciden dos filas es igual a cero. 
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Cambiando las filas entre sí se puede conseguir que las fillas 
coincidentes sean la primera y la segunda. El determinante de la 
matriz con las filas cambiadas o bien coincidirá con el determi- 
nante de la matriz inicial o bien diferirá de él en el factor —1. 
De la fórmula (5) se ve directamente que el determinante de una 
matriz en la que coinciden las dos primeras filas es igual a cero. 
Por esto será también igual a cero el determinante de la matriz 
inicial. 

COROLARIO 2. Si a los elementos de la r-ésima fila cualquiera de 
la matriz cuadrada A=||a,,ll se agregan los elementos correspondien- 
tes de otra fila s-ésima cualquiera (sr) multiplicados por un fac: 
tor arbitrario à, el determinante de la matriz nueva será igual al 
determinante de la inicial. 

En efecto, según los teoremas 3 y 4 del punto anterior, se tiene 


Ay e Zin Qn Qin A am 
Ar rn Arn Orn Ar Orn 
RA m EEeTS yif e 
Qn A + - Qen Qn Apn 
Am - Ann Om -i Oun 


Aquí el último determinante tiene dos filas coincidentes y, por 
consiguiente, es igual a cero. 
asta el momento todos nuestros resultados estaban relacionados 

con las filas de los determinantes. Hagamos el primer paso para 
introducir en el juego las columnas. 

teorema 2. Para toda matriz cuadrada A=||a,,I| de orden n es 
válido el siguiente desarrollo según los elementos de la primera 
columna: 


lA l= an ¡AL [an (AG (++. > (19% m AA, (6) 


donde Al es la matriz que se obtiene de A suprimiendo la primera 
columna y la r-ésima fila. 

Consideremos que los elementos a; de la matriz dada son letras. 
Entonces, el determinante de la matriz A será un polinomio en 
estas letras cuya forma general se ha establecido en el teorema 1 del 
punto anterior. En particular, hemos señalado allí que cada término 
del polinomio |A| contiene un factor, y sólo uno, perteneciente al 
conjunto Oy) ayy +, Œm Agrupemos en | A] todos los términos 
que contienen el. facior æ, saquemos fuera de los paréntesis este 
factor común y designemos mediante A,, la expresión comprendida 
entre los paréntesis. De esta forma obtendremos 


lAl = anA +0 An +++ Ana (7) 
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Comparando las fórmulas (7) y (1), llegamos a la conclusión de 
que 
Au=/41l. 


Para hallar la ión análoga para A,,, es suficiente re 
ahora al teorema 1. En efecto, cambiemos sucesivamente la r-ésima 
fila de la matriz A con cada una de las anteriores, elevándola más 
y más. Después de r—] intercambios de esta índole obtendremos 
una matriz B que difiere de la matriz A sólo en el orden de filas 
y, por consiguiente, tendremos 


lAļ=(—1y~ |B]. 
Desarrollando el determinante B según los elementos de la pri- 
mera fila, obtenemos 


18]=0,.1B3|—d | Bil+ (19%! 0701 81), 
y por lo tanto 
1Al=0 (IU Bl. +(1/917%,, 1801. 
Comparando este desarrollo con el de la fórmula (7), llegamos 


a la relación 
An=(—1Y] Bi]. 


La matriz Bj se obtiene suprimiendo en la matriz B la primera 
fila y la primera columna. Está claro que la misma matriz se ob- 
tendrá al suprimir en A la r-ésima fila y la primera columna, es 
decir, que Bi= A}. Sustituyendo en la fórmula (7) el valor A, 
por el valor (—1)=*] At}, obtenemos el desarrollo deseado (6). 

Anteriormente hemos indicado que la matriz, en la que la pri- 
mera, la segunda, etc. filas coinciden respectivamente con la pri- 
mera, la segunda, etc. columnas de la matriz A, se llama trans- 
puesta respecto de A y se designa por A’. Es evidente, que siendo A 
una matriz cuadrada de orden n, la matriz A” es también una 
matriz cuadrada de orden n. 

TEOREMA 3. El determinante de una matriz cuadrada no varía en 
la transposición, es decir, 


14'1=141 (8) 


Para matrices de orden uno la proposición es evidente. Recu- 
rriendo, al igual que antes, a la inducción, aceptemos que la ma- 
iriz dada A= ||æ;;]| es de orden n>1 y que el teorema es cierto 
para las matrices de orden n—1. Desarrollando el determinante de 
la matriz A según tos elementos de la primera fila y el determinante 
de la matriz transpuesta A” según los elementos de la primera 
columna, obtenemos 


[4]=2, 141%: A+... +10 143), (0) 
|8 [San HAD Ia AlE -e HI- anA A 
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Sin embargo, es fácil ver que (4”)? =(4£Y. Las matrices 4% son 
de orden n—1 y, por la hipótesis de inducción, se tiene 


HAD =1(AY IIA (i=l, a, n). 


Comparando estas relaciones con los desarrollos (9) obtenemos (8). 

Por consiguiente, al calcular el determinante de una matriz las 
columnas y las filas pueden ser sustituidas unas por otras. Esto 
significa que de todo teorema referente a las propiedades del deter- 
minante de una matriz, enunciado en términos de filas o de colum- 
nas, se puede obtener un nuevo teorema sustituyendo las filas y las 
columnas unas por otras. En particular, de las propiedades de los 
determinantes indicadas anteriormente y relacionadas con las filas, 
obtenemos el resultado siguiente. 

COROLARIO. Al cambiar entre sí dos columnas de una matriz su 
determinante adquiere el valor opuesto. El determinante de una ma- 
triz cuadrada que tiene dos columnas idénticas es igual a cero. Si se 
multiplican todos los elementos de una columna de la matriz por A, 
el determinante de la matriz también quedará multiplicado por h. 
Si se agregan a todos los elementos de una columna de la matriz los 
elementos correspondientes de otra columna, multiplicados por un 
número fijo, el determinante de la matriz nueva será igual al deter. 
minante de la inicial. 

Análogamente, sustituyendo las filas por las columnas obtenemos 
del desarrollo (5) el desarrollo según las dos primeras columnas: 


(4J= Y arre] Sa ze. am 


izi Ye 


Finalmente, del teorema de adición de determinantes, enunciado 
en términos de filas, obtenemos la fórmula correspondiente 


ap Bi oee a 


A Qj sso Oha 


referente a las columnas. 

Hasta el momento nos hemos valido de los desarrollos de un 
determinante según los elementos de su primera fila o su primera 
columna. Al mismo tiempo, conocemos la ley de variación del de- 
terminante al cambiar en él entre si filas o columnas. Esto ofrece 
la posibilidad de obtener inmediatamente de los desarrollos según 
los elementos de la primera fila o la primera columna los desa- 
rrollos análogos según los elementos de cualquier fila o columna. 
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TEOREMA 4. Para una matriz cuadrada arbitraria A=|0%yl| de 
orden n son válidos los siguientes desarrollos según los elementos de 
la r-ésima fila y s-ésima columna: 
14]=(009 0 147 ]4 ++ +H(—=1)9% 0,0] 421, (10) 
141=D asl Ai] + ("051 AR (11) 
donde Aj es la matriz que se obtiene de A suprimiendo la i-ésima 
fila y la j-ésima columna. 
Puesto que las filas y las columnas se encuentran en las 
mismas condiciones basta demostrar sólo una de las fórmulas (10) 
y (11), por ejemplo, la fórmula (10). Cambiando sucesivamente la 


résima fila de la matriz A con cada una de las anteriores, después 
de r—1 intercambios obtendremos la matriz 


Arn Qr r- Orm 
au On sse Om 
B =| Qrem AA AS |. 
Areri Arer, rs 


Om Om +e Onn 


Según el teorema sobre el intercambio de filas tenemos | 4|= 
=(—1)y="| B|. Desarrollando aquí el determinante B según los 
elementos de la primera fila y empleando las relaciones evidentes 
Bí= Af, llegamos al desarrollo (10). 

El determinante de la matriz Aj se llama menor del determi- 
nante de la matriz Æ correspondiente al elemento æ;y. La expresión 
(= 141401 se llama adjunto del elemento «yen | 4] y se designa 


con frecuencia mediante [ 4|,, Empleando el concepto de adjunto, 
las fórmulas (10) y (11) pueden ser representadas en forma más 
breve: 
anl Ajat aal Alat. Html Aln=14), a2) 
Gul Ahit ant Alit -Han l Al =1 41. (13) 


En estas igualdades cada elemento œ; se multiplica por su 
adjunto | A|,,. ¿Qué sucederá si se toma la suma de los productos 
de los elementos de la ¡-ésima fila por los adjuntos de los elementos 
correspondientes de otra fila cualquiera? Con el fin de obtener la 
respuesta, sustituyamos la ¿-ésima fila de la matriz dada A por 
su ¿ésima fila sin alterar todas las filas restantes, incluyendo tam- 
bién la ¡-ésima. Obtendremos una matriz B en la que son idénti- 
cas las filas i-ésima y j-ésima. El determinante de esta matriz es 
igual a cero. Al mismo tiempo, es evidente que los menores de 
los elementos de la ¡-ésima fila en los determinantes de las matrices 
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A y B coinciden. Desarrollando B según los elementos de la ¡-ésima 
fila, obtenemos 


%lAl+- +0 4lp=0 GA. (14) 


Sustituyendo en los razonamientos las filas por las columnas 
obtenemos la segunda serie de relaciones: 


lA ly+..+oylAl=0 i) (15) 


Las relaciones (12), (13), (14) y (15) suelen enunciarse de la 
forma siguiente. 

TEOREMA 5, La suma de los productos de los elementos de una 
fila (de una columna) de un determinante por sus adjuntos es igual 
al valor del determinante. La suma de los productos de los elementos 
de una fila (de una columna) de un determinante por los adjuntos 
de los elementos correspondientes de otra fila (columna) cualquiera 
es igual a cero. 

lagamos ahora algunas observaciones acerca de los métodos de 
cálculo de determinantes. Los determinantes de orden dos y tres 
se calculan generalmente mediante las fórmulas iniciales. Por ejemplo, 


241 1112] +2125]+5)2 4007. 


Aquí hemos desarrollado el determinante de orden tres según 
los elementos de su primera fila. Si uno de los elementos del de- 
terminante dado fuese igual a cero, resultaría más conveniente 
recurrir al desarrollo según aquella fila (o columna) que contenga 
este elemento nulo. Este mismo método se puede aplicar al calcular 
determinantes de orden elevado que contienen muchos elementos 
iguales a cero. En particular, tenemos 


Air gor Oin a 
an 
Sages P has + | re" > A 
(A Can 
y análogamente 
0 wii 
an A ~ fæ 
nin- 
=(—1) Ea AN 
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La situación es más compleja si ei orden del determinante dado 
es relativamente elevado (por ejemplo, 7 y más) y entre los elemen- 
tos del determinante hay pocos ceros o no los hay. En este caso, 
al determinante se aplican primero las transformaciones indicadas 
en el corolario 2 del teorema 1, tratando de escoger el coeficiente A 
de modo que el determinante nuevo contenga en algunos lugares 
ceros o tenga en cierto sentido una estructura más sencilla, Éstos 
métodos se ven con claridad en el ejemplo siguiente. Supongamos 
que debemos calcutar el determinante 


Restando en este determinante la quinta fila de la sexta, res- 
tando en el determinante obtenido la cuarta fila de la quinta, 
restando después la tercera fila de la cuarta, etc., obtenemos 

t sst s 6 
1 LH 1—5 


1 
l l l L—5 1I 
ely Ese 4.4 
1 1-5 1 1 1 
1—5 1 1 1 4 


Restando ahora la sexta fila de la primera, de la segunda, ... 
..., de la quinta, obtenemos 


3 

0 

0 
=l 

0 


En el determinante obtenido de orden cinco agregamos a la 
primera columna las restantes y después desarrollamos el determi- 
nante según los elementos de la primera columna. Tendremos 


2 2 3 4 6 

0.0 0 0-1 
d=—6-| 0 0 0] 0|=—6*21 

0 0-1 0 

0-1 0 0 0 
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Mediante cálculos análogos se obtiene también la fórmula general 


123.. 
234 


n=l n 


nue 


am qn 
«0 * NR y 


Este determinante lleva el nombre de circulador de orden n, 
debido a que sus filas se obtienen por permutaciones cíclicas de 
los elementos de la primera fila. Es esta regularidad en la dispo- 
sición de los elementos del determinante en la que se basa la 
deducción de la fórmula (16) que, a propósito, no será empleada 
en lo sucesivo. Actualmente para hallar el valor numérico de los 
determinantes de orden elevado se recurre a los servicios de los 
centros de cómputo en los que existen programas standard para 
el cálculo de determinantes adaptados a aquellos tipos de máquinas 
con las que está equipado el centro. Hallemos la estimación apro- 
ximada del número de operaciones aritméticas suficiente indudable- 
mente para el cálculo del determinante de una matriz arbitraria 
llo, | de orden n. 

Supongamos que a0. Calculamos «az? y representamos el 
determinante dado en fa forma 


1 aa 

1an 
Aa in a 
lae 15a 


Durante esta operación realizamos una inversión y n—1 multipli- 
caciones. A continuación, agregamos a los elementos de la se- 
gunda, de la tercera, ..., de la n-ésima filas los elementos de la 
primera fila multiplicados respectivamente por —@n, ~as -+s 
—4,, (un total de (n—1)* multiplicaciones e igual número de 
adiciones). Después de esto el problema se reduce al cálculo de un 
determinante de orden n— 1: 


aia ai, amt 
n ES 
Gaii ee Oami, a= 
Continuando este proceso, tendremos que calcular al finai del 
mismo solamente el producto œ% ... ag” (es decir, n—1 


multiplicaciones). Al aplicar el algoritmo expuesto necesitaremos 
realizar un total de n—1 inversiones de números, de 
n A 


Qat) n (11 
PE T 


multiplicaciones, de adiciones y de n—1 multipli- 


caciones finales. Por lo tanto, para calcular un determinante de 
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orden n es necesario efectuar aproximadamente cerca de 4a” mul- 


tiplicaciones y de un número igual de adiciones. No nos deten- 
dremos aqui en el estudio más detallado de esta cuestión. Varias 
definiciones y resultados exactos se indican en el artículo de B. A. /Tan, 
„O cnoco6ax BbIYHCACHHA 3HAYEHHÄ MRorownenoB”, Ycnexa Matema- 
Ttmueckmx Hayk 21, Ne 1 (1966), 103—134 (V. Ya. Pan, Acerca 
de los métodos de cálculo de valores de polinomios), así como en 
la bibliografia señalada en este articulo. 


2.3, Determinante de un producto. Matrices inversas. Un papel 


importante lo desempeña en la teoría de matrices el siguiente teo- 
rema. 

TEOREMA 1 (sobre la multiplicación de determinantes). El deter- 
minante del producto de matrices cuadradas (formadas por elementos 
pertenecientes a un anillo conmutativo K) es igual al producto de 
los determinantes de las matrices. 

Sean dadas dos matrices cuadradas A=(|0,,l| y B=} B] de 


orden n. En virtud del teorema sobre las matrices semidescom- 
puestas (p. 2.1), se tiene 
Ly Zis eee Auw O 0... 0 
-A 0 0... 0 
AS 
Al | 8B]=|[%n Sm -> Sm |, 
i E a A O A 
0 Esas 0 Pabass Be 
o 0 —1 Pas Bro Ban 


En el segundo miembro aparece el determinante de una matriz 
de tipo especial de orden 2n. Sin alterar el valor del determinante, 
con esta matriz se pueden realizar sucesivamente las siguientes 
transformaciones: agregar a su primera fila los elementos de la 
{n+ 1)-ésima fila multiplicados por æ, los elementos de la (n + 2)- 
ésima fila multiplicados por æ, etc., los elementos de la 2n-ésima 
fila multiplicados por œ. Así surgirá una matriz de orden 2n, en 
la que las primeras z posiciones de la primera fila estarán ocupa- 
das por ceros, mientras que las otras n posiciones estarán ocupa- 
das por los productos de la primera fila de la matriz A por las 
columnas de la matriz B. En la nueva matriz de orden 2n agre- 
gamos ahora a los elementos de su segunda fila los elementos de 
la (n-+1)-ésima fila, de la (n-+2)-ésima fila, etc., multiplicados 
respectivamente por ds, Go >.» Son. Después realizamos trans- 
formaciones análogas con la tercera, ..., con la ri-ésima filas. 


41843 
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Después de esto obtenemos la igualdad siguiente: 


0... 0 Hair + Dau Bin 


Para reducir el determinante de la derecha a Ja forma semides- 
compuesta, cambiamos en él la primera columna con la (n+ 1)- 
ésima, la segunda con la (n-+2)ésima, ..., la n-ésima con la 
2n-ésima. Así obtendremos la igualdad 

Dauba Dauba O... 0 


o 


Puesto que el determinante de una matriz semidescompuesta es 
igual al producto de los determinantes de las células diagonales, 
de la relación (1) se deduce que 


1A118/=( 0" 


es decir, 
14|-18|=/4B1, (2) 
que es lo que queriamos demostrar. 

Hemos demostrado el teorema 1 para el producto de dos matri- 
ces. Está claro que de aquí se desprende su validez también en el 
caso del producto de un número finito cualquiera de matrices. Por 
ejemplo, 

14BC|=|(4B)C|=]AB|-|C|=1A]-|B}|C]. 
En particular, para cualquier matriz cuadrada A se tiene 
[4 =/4]* (k=0,1,2,...). 43) 
Sabemos que la transposición de una matriz cuadrada no altera 


su determinante. Por ello, para dos matrices cuadradas cualesquiera 
de un mismo orden, se tiene 


/41-18/=/48|=/4'B|=14B'|=/4'B"|. 
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Sea, por ejemplo, 


A ff Aha 
uv 
En este caso, se tiene | 
„n |2 +e xu+yo 
ARA =| upo n pee [FEHU (+ yo, 
es decir, 


(xu— yu)? = (x° + 99) (u? 4-0) — (xu + yo)". 
Esta relación suele escribirse en forma de la siguiente identidad 
OEH’) (u? -+ 0t) = (xv — yu)? + (xu + yo) 
que se denomina identidad de Lagrange. 

Empleemos ahora el teorema 1 para un estudio más detallado 
de las propiedades de la matriz inversa. 

Consideremos una matriz cuadrada cualquiera A =|| æl] de or- 
den n. Formemos una matriz con los adjunts de los elementos del 
determinante A y tomemos su transpuesta. La matriz asi obtenida 
se llama adjunta de A y se designa mediante A*. En otras pala- 
bras, 

lA lu lAa ++ Aln 


Calculando los productos A-A* y A*.A según la regla de mul- 
tiplicación de matrices y teniendo “en cuenta las fórmulas de (12) 
a (15) del punto anterior, obtenemos directamente las relaciones 


importantes 
A-A=A Am |A]-E, 4) 


donde E es la matriz unidad. 
El determinante de la matriz A es un elemento del anillo prin- 
cipal K, del cual se toman los elementos de todas las matrices 
consideradas. Supongamos que para el elemento | A | existe en K su 
inverso | 4|=*. Entonces, multiplicando las relaciones (4) por | 4]-*, 

llegamos a tas igualdades 
AJAA =A 


de donde se deduce que 


.A=E, 


A- =| Al. A*. (5) 
Por otra parte, si la ecuación matricial 
AX=E 
qe 
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tiene solución, obtenemos pasando a los determinantes 
14]-1X]=1, 


es decir, el elemento | A| es invertible en el anillo K. 

Uniendo los resultados oblenidos, llegamos a la proposición 
siguiente, 

TEOREMA 2 Una matriz cuadrada A, formada por elementos de 
un anillo conmutativo K con el elemento unidad, posee la matriz 
inversa, también formada por elementos de K, si, y sólo si, el deter- 
minante de A es invertible en el anillo K. Si la matriz inversa 
existe, su determinante es igual al inverso del valor del determinante 
de la matriz dada. 

Por ejemplo, en el anillo de todos los números enteros 
K=40, zEl, ...) poseen inverso solamente los elementos 1 y —l. 
Por lo tanto, una matriz cuadrada formada por números enteros 
posee la matriz inversa, también formada por números enteros, si, 
y sólo si, el delerminante de la matriz dada es igual a xl. 

Supongamos que se consideran matrices formadas por elementos 
de un cuerpo conmutativo. En un cuerpo conmutativo, todo ele- 
mento no nulo posee su inverso. Por ello, sobre un cuerpo conmu- 
tativo son invertibles aquellas matrices, y sólo aquéllas, cuyos 
determinantes son diferentes de cero. 

Una matriz cuadrada cuyo determinante es igual a cero se 
llama singular. En el caso contrario, la matriz se llama regular. 
Por esto, la condición indicada anteriormente para que una matríz 
sea invertible puede se^ enunciada de la forma siguiente: una ma- 
triz cuadrada sobre un cuerpo conmutativo posee inversa si, y sólo 
si, es regular. 

Hemos visto que para matrices A regulares sobre el cuerpo 
conmutativo K, se tiene 


14] =/Ajre 


De aquí obtenemos 
JA =S|AT 0 ARS JA (m=1,2,...), 


de modo que la fórmula (3) es válida no sólo para los valores 
naturales de k, sino también para cualesquiera valores enteros de k 
(siempre que la matriz A sea invertible). 

Según el p.1.3, una matriz cuadrada A se Hama ortogonal, si 


AA'=A'A=E. 


Pasando a los determinantes, obtenemos |A|*=1 y, por ello, 
si las matrices se consideran sobre un cuerpo conmutativo K, se 
tiene |A|==+1. Gracias a esto todas las matrices ortogonales se 
descomponen en dos conjuntos de matrices: las matrices ortogonales 
propias de determinante +1 y las matrices ortogonales impropias 
de determinante —1. Todas las matrices ortogonales propias for- 


$ 2. Determinantes EN 


man, respecto a la operación de multiplicación, un grupo que 
constituye un subgrupo del grupo de todas las matrices ortogonales. 

Recordemos que una matriz cuadrada A definida sobre el cuerpo 
de los números complejos se llama unitaria si AA’ =E. Tomando 
los determinantes, obtenemos | A]-[A]=1, es decir, el módulo del 
determinante de una matriz unitaria es igual a la unidad. 

Para concluir hallemos el determinante de la matriz adjunta. 
Aceptemos que el anillo K es el anillo de tos polinomios en le- 


tras x; (i, i=], ..., n) con coeficientes enteros y consideremos la 
matriz X=(|x,,l|. Según la fórmula (4) se tiene 
X-X*=/X|-E 


y por lo tanto 
IX XX o 
Puesto que el polinomio |X] es diferente de cero, la igualdad 
puede ser dividida por |X| y así obtenemos la fórmula deseada 
1X*=| X=, (6) 
ambos miembros de la cual son polinomios en las variables x,, con 
coeficientes enteros. Pero, si coinciden dos polinomios de este tipo, 
también coinciden sus valores para cualesquiera valores de las 
variables pertenecientes a un anillo conmutativo arbitrario, Por 


esto, la fórmula (6) es válida para matrices cuadradas arbitrarias 
sobre cualquier anillo conmutativo. 


2.4. Sistemas cramerianos de ecuaciones lineales. Consideremos 
el conjunto de condiciones 


Abre + Ann = Bro ) 
Omi +- mn = Bas 

donde E,, ..., E, son letras, mientras que «;, y f, son elementos 
de un anillo K. El conjunto de estas condiciones se llama sistema 
de ecuaciones lineales con las incógnitas E,, ..., En Sobre el anillo K. 
Una sucesión El, ..., Es de elementos del anillo K se llama solu- 
ción del sistema (1) si al tomar en las condiciones (1) en lugar de 

n 


las variables E, ..., E, los elementos correspondientes Ẹt, ..., E 
todas las condiciones resultan veridicas. Introduciendo las matrices 


d) 


Fan e an? 5] Pi 
aaj cocos], sml; | y daj: |, 
pesa Bel | Ba, 


el sistema (1) puede ser representado en la siguiente forma ma- 
tricial 


Ax=b. (2) 


54 Cap. 1. Matrices y delerminantes 


La matriz A se llama matriz del sistema (1) y la matriz 


Fau o Au BT 


Lami +++ Ban Ban 


se llama matriz ampliada del sistema (1). Las propiedades de la 
matriz B nos harán falta en el p. 5.3 al estudiar de form» más 
detallada las propiedades del sistema (1); por ahora nos limitare- 
mos a considerar el caso en que m =n, es decir, en que la matriz A 
es cuadrada. Supongamos que la matriz A es invertible. En este 
caso, multiplicando ambos miembros de la igualdad (2) a la izquier- 
da por A“! obtenemos 


x=A7!b, 43) 


Viceversa, multiplicando la relación (3) a la izquierda por A, 
obtenemos (2). Por consiguiente, las condiciones {2) y (3) son equi- 
valentes y por ello la fórmula (3) puede ser considerada como la 
fórmula que ofrece la solución del sistema de ecuaciones (1) siempre 
que la matriz del sistema sea invertible, 

Hasta el momento no hemos supuesto siquiera que el anillo K 
sea conmutativo. Supongamos ahora que K es un cuerpo conmuta- 
tivo. En este caso, el hecho de que Ja matriz A sea invertible 
equivale a que sea regular; la matriz inversa se expresará en tér- 
minos de la matriz adjunta en la forma anteriormente señalada 
y la fórmula (8) podrá ser representada de la forma siguiente 


x=] A|-'A%. 


Tomando en lugar de la matriz A* su expresión en términos de los 
adjuntos del determinante |A] y realizando la multiplicación en 
el segundo miembro, obtenemos 


1A |: +A} 


ASA 
o bien, en forma definitiva, 


Qu sas Qi ini Ba On, sa 


teg 


Qa ee Gn joi Bu Oros -+> Qan 


Para comprobar bastará desarrollar el determinante que figura 
en el numerador según los elementos de la ¡-ésima columna. 

Un sistema de ecuacionis lineales sobre un cuerpo conmulativo 
se lama crameriano si el múmero de ecuaciones coincide con el 


$ 2. Determinantes 55 


número de incógnitas y si el determinante de la matriz del sistema 
es diferente de cero. Vemos, por consiguiente, que fodo sistema 
«rameriano de ecuaciones lineales tiene una solución, y sólo una, 
Èo -:.+ E) y que esta solución viene dada por las fórmulas (4). 
Las fórmulas (4) se llaman fórmulas de Cramer, en memoria de 
Cramer, matemático de mediados del siglo pasado, ya que aparecie- 
ron, por lo visto, por primera vez en uno de sus trabajos. Para 
n=2 y n=3 las tármulas de Cramer han sido dadas de forma 
detallada en el p. 2.1. 

Las fórmulas de Cramer dan una expresión «cerrada» de la solu- 
ción de un sistema crameriano de ecuaciones en términos de los 
coeficientes de estas ecuaciones. Sin embargo, no es conveniente 
hallar la solución de un sistema lineal empleando las fórmulas de 
Cramer, En efecto, recurriendo a las fórmulas de Cramer, habrá que 
calcular los valores de n+1 determinantes de orden n. Según las 
estimaciones aproximadas, realizadas en el p. 2.2, habrá que efec- 
tuar para ello cerca de n* multiplicaciones y adiciones. Al mismo 
tiempo, el método corriente de eliminación Sucesiva de incógnitas 
requiere, como ahora veremos, un número de operaciones conside- 
rablemente menor, Este método, ordenado de modo adecuado, se 
lama en la actualidad algoritmo de Gauss. 

Consideremos, pues, de nuevo el sistema de ecuaciones linea- 
les (1) cuyos coeficientes han sido tomados de un cuerpo conmuta- 
tivo K. Si todos los coeficientes de una de las ecuaciones son 
iguales a cero podemos suprimirla del sistema. Si los coeficientes 
de las incógnitas son iguales a cero, mientras que $0, el sistema 
no tieve solución. Por esto se puede aceptar que algunos de los 
coeficientes de las incógnitas en la primera ecuación son diferentes 
de cero. En este caso, cambiando si es necesario la numeración de 
las incógnitas, podemos llevar el sistema a la forma (1) en la que 
an 0. Calculemos ej? y multipliquemos todos los miembros de 
la' primera ecuación por ayi. A continuación, de la segunda, de 
la tercera, . de la m-ésima ecuaciones restamos término por 
término la primera ecuación multiplicada por dy, Os, .-., Cimi 
respectivamente. Después de esta operación nuestro sistema inicia! 
resultará ser equivalente al sistema de tipo 


Eso A Hainai ) 
A | 

Ambato > + man Bn. ) 

Al pasar del sistema (1) al sistema (5) hemos realizado una 
inversión, nm multiplicaciones y n(m—1) adiciones. Procediendo 


de la misma forma con las últimas m— 1 ecuaciones del sistema (5), 
obtendremos — después de una inversión, de (2—1) (m— 1) multiplica: 


(5) 
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ciones y de (1—1)(m—2) adiciones—el sistema de tipo 


Ei Hais + se Aian = 

tanët.. + anën = 

Anaa -o e H amn = 

Continuando el procese indicado, podremos encontrarnos con 

tres casos: a) en uno de los pasos llegamos a la conclusión de que 
el sistema no tiene solución; b) obtendremos un sistema de tipo 

BH Yei oo E Va rairit -e H Yanda = Ôp 
ht- 


Er Ya raie t 


a de tipo 


e) obtendremos un siste 


Bat Vata Vesta + e e Yann = À, 
Est Yatt 
AE a Ea (6) 
A 


En el caso b), expresamos E,, empleando la última ecuación, en 
términos de las incógnitas «libres» E,.,, ..., Ey. Introduciendo el 
valor obtenido de E, en la ecuación anterior, hallamós de ella E,.,, 
etc. De esta forma encontraremos unas expresiones lineales de las 
incógnitas E,, ..., E, en términos de las incógnitas «libres». Dando 
valores arbitrarios a las incógnitas «libres», podremos, a partir de 
las fórmulas señaladas, calcular los valores correspondientes de las 
incógnitas ., E, y obtener de esta forma una solución E,, ... E, 
seu <= +» En del sistema dado. Lo mismo ocurrirá en el caso c); la 
diferencia consistirá solamente en que en este caso oblendremos unos 
valores determinados para todas las incógnitas E, .... Ey 

Calculemos el número de operaciones que hay que efectuar en 
el caso c) para obtener la solución. Para reducir el sistema a la 
¡orma 46) taceptando que m = n) tendremos que realizar n inversiones. 


EE O 
inultiplicaciones y 
nta) +(—1)(1—2+...+2-1 =3 (0 +Dn(—0b 


adiciones. Además, para hallar del sistema triangular (6) las incóg- 
nitas habrá que realizar adicionalmente 


1424 +1) = 


(—1) 
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multiplicaciones y un número igual de adiciones. Por consiguiente, 
para resolver el sistema (1) empleando el método de Gauss, es ne- 
cesario realizar, en el caso general, n inversiones, 


Latansa q 
multiplicaciones y 
nmaa 


adiciones. 

Observemos ahora que empleando el método de Gauss puede ser 
calculada también la matriz inversa A”'. Esto se logra de la forma 
siguiente, Se escribe el sistema de ecuaciones lineales Ax=b, en el 
que las columnas x y b se consideran formadas por letras. Después, 
a partir del sistema dado y empleando el método de Gauss, las 
variables E, ..., E, se expresan en términos de las variables 
Bn...» Pa. Así se obtienen fórmulas de tipo 


imat ee H YaPa (=l, p 1) 
Puesto que de Ax=b se deduce que x= A=b, la matriz [)y,,!l 


será precisamente la inversa de A. El cálculo de] número de ope- 
raciones muestra que en este caso es suficiente realizar n inversio- 
nes, yn l4nt—1) æ $n? multiplicaciones y $ (n—n) (20—1)= $ n? 
adiciones. 

En los cálculos que hemos realizado acerca del número de ope- 
raciones necesarias para hallar el valor del determinante de una 
matriz, la solución de un sistema de ecuaciones lineales o la inver- 
sión de una matriz, no se han tenido en cuenta algunas operaciones 
secundarias, así como el aumento del número de cifras decimales 
en los números que se multiplican o se suman. Sin embargo, los 
resultados obtenidos pueden resultar útiles al decidir, si un sistema 
de ecuaciones lineales de interés práctico debe ser resuelto a mano 
o conviene pasar el encargo a un centro de cálculo. 


Complementos y ejerciclos 
1. Empleando las fórmufas de Cramer, resuélvase cl sistema 
x+y+z=—2, 
1421 4, 
Pill, 
Y 2H =. 
2, Empleando el método de Gauss háltense las inversas de las matrices 
+1 a a a 
E y a al a a 
3-1 1 a a apli a| 
a a a alj 
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3. Demuéstrese la fórmula (determinante de Vandermonde) 
Dt 


e 4 
do A 
aq 
4, Demuéstrese que 
arn a a 
a 
a 


5. Si en el anillo principal K para cualquier a de 2a=0 se deduce que 
a=0, el determinante de cualquier m: simétrica sobre K de orden impar 
es igual a cero. 

'6. Consideremos una matriz cuadrada arbitraria A (sobre un anillo conmu- 
tativo K) de orden n. Suprimiendo en A las filas con los números ín ..0s ir 
(h <... <i, En) y las columnas con los números jı, .-., j (1) < 
<... < jpn), obtendremos una matriz nueva Alt *: fr de orden n—r. Los 
elementos de la matriz A que se hallan en los cruces de las filas y de las co- 
lumnas suprimidas también formen una matriz cuadrada. El orden de esta última 
matriz es igual a z. Su determinante se denomina menor de orden r del deter- 
mínante de la matriz A perleneciente a las files con los números i, ..., iy y 
a las columnas con los números jı, ==. [y Se llama adjunto de este menor el 
determinante de la matriz Af: :** fy multiplicado por (—1)%*t, donde s= i, + 
+.. +i, y tmh... + ip. Tiene iugar la siguiente generalización del desu- 
Troilo de un determinante según los elementos de la primera y de la segunda filas: 
si en un determinante de orden n se fijan r filas cualesquiera, la suma de los 
productos de los menores de orden r, pertenecientes a las filas escogidas, por sus 
adjuntos es igual al valor del determinante dado. 

7. Si la matriz cuadrada dada X es simétrica o antisimétrica, la motriz 
adjunta_X* también es simétrica o antisimétrica, 

8. Sea A una matriz cuadrada de elementos enteros y sean x y b unas co- 
lumnas, cuyos elementos son letras: E, ..., En y Br» +--> Pp, respectivamente. 
El sistema de ecuaciones lineales Ax=b tiene soluciones enteras ĝa, ..., En para 
cualesquiera valores enteros de By, ..., Bn si, y sólo si, |A]=x1 
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Todas las matrices que se consideran en este parrágraío se su- 
ponen cuadradas y de un mismo orden n. Los elementos de estas 
matrices se toman de un cuerpo conmutativo K cualquiera, pero fijo. 


Semejanza de matrices. La matriz A se llama semejante a 
la matriz B, si existe una matriz no degenerada X, tal, que 
A=X-BX. y 
En este caso también suele decirse que la matriz A es la transfor- 
mada de B por X. Multiplicando la igualdad (1) a la izquierda por 
X y a la derecha por X”!, obtenemos 
B=XAX-""=(X71)1 AX, 
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Por consiguiente, la semejanza de A con B implica la semejanza de 
R ron A. Además, si 


A=X^BX y B=Y-CY, 
realizando la sustitución obtenemos 
A=(YX)'C(VX). 


Por consiguiente, dos matrices, semejantes cada una a otra tercera, 
son también semejantes. Es obvio, finaimente, que toda matriz es 
semejante a si misma. 

Estas propiedades demuestran que el conjunto de todas las ma- 
trices cuadradas de un orden dado 11, formadas por elementos de un 
cuerpo conmutativo K, se descompone de un modo natural en clases 
de matrices semejantes. Uno de los problemas centrales de la teoría 
de matrices es el de hallar las condiciones necesarias y suficientes 
de semejanza de matrices. La solución de este problema será dada 
en el capitulo 1V. Aquí estableceremos solamente algunas propieda- 
des previas de matrices semejantes. 

Para transformar una suma de malrices por X es suficiente trans- 
formar pur X cada sumando. 

En efecto, 


XA, HA + RAY =X UA XX TA XA. 


Para transformar un producto de matrices por X es suficiente 
transformar cada factor 
Efectivamente, 


XAAX-XAAX co. KAAK =X AA, ... AX. 
ya que los productos XX~*, que aparecen en el primer miembro, 
son iguales a E y pueden ser omitidos. 
Para transformar una potencia de una matriz es suficiente trans- 
formar la base de la potencia, es decir, se tiene 
XAAP9X =(X2AX)". 
Si m>0, esta fórmula es un caso particular de la anterior. Si 
m<0, tomemos k=— m. Entonces tendremos 
XHAMX =X MATO X = (XI A~ XYP = (X~ AX)" =(X 7! AX)". 
El valor transformado de un polinomio en una matriz es igual 
al valor del polinomio en la matriz transformada, en otras palabras, 
XA) =f (XA AX). 
Esta proposición es resultado inmediato de las anteriores, ya 
que el valor de un polinomio en A se obtiene a partir de A rea- 


lizando operaciones de elevación a potencias, de multiplicación por 
número y de adición. 
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Las reglas de la transformación de expresiones permiten en mu- 
chas ocasiones simplificar considerablemente los cálculos. Sean, por 


ejemplo, i 
1 2.1 
a=|o ij y x=|3 2l- 
Por inducción es fácil demostrar que 
ME 
A =l; 


Puesto que 
xax=[_7 4 
=9 —5|” 
tendremos, aplicando la regla de transformación de una potencia, 


(3 Blc IE ia] 


3,2, Polinomio característico. Sea A una matriz cuadrada y sean 
Qiy (i 1,2, , n) sus elementos. La matriz 


Stn 


«AO 


donde A es una variable independiente, se llama matriz característica 
de A. Su determinante 
y0)=|E—A| a) 


es evidentemente un polinomio en 2 y se llama polinomio caracte- 
rístico de la matriz A. 

Para hallar los primeros términos de este polinomio recurramos 
a que el valor de un determinante es igual a la suma de los pro- 
ductos de sus elementos tomados de modo que haya uno de cada 
fila y uno de cada columna y provistos de signo adecuado. Para 
hallar el término de mayor grado respecto a À es necesario tomar 
los productos de los elementos de mayor grado. Es nuestro caso este 
producto será uno solamente, a saber, el producto (A—a,,) (A— da) - . « 

(A— dt) de los elementos diagonales. Todos los demás productos 
que componen el determinante serán de grado no mayor que 1—2, 
ya que siendo —a; (i4 j) uno de los factores de alguno de estos 
productos, el último no contendrá los factores 2—ay Y A—a, y, 
por consiguiente, será de grado no mayor que n—2. De este modo, 
PA) ={A— an) --- (Aann) + términos de grado no mayor que 


n—2, o 
ASA (Ad Ea) ATI e) 
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La suma de los elementos diagonales de una matriz se llama 
traza de la matriz. Según la fórmula (2), el grado del polinomio 
característico de una matriz es igual al orden de esta matriz, el coe- 
ficiente principal del polinomio característico es igual a 1, mientras 
que el coeficiente de 1.%-1 es igual a la traza de la matriz tomada 
con el signo contrario. Si en la fórmula (2) tomamos A =0, tendremos 


P(0)=|—A]|=(-1)141. 

Pero (0) es el término independiente del polinomio característico. 
Es decir, el término independiente del polinomio característico de 
una matriz A es igual al determinante de esta matriz multiplicado 
por (—1)", donde n es el orden de la matriz A. 

El teorema que sigue describe una de las propiedades mús im- 
portantes del polinomio característico. 

TEOREMA 1. Los polinomios característicos de matrices semejantes 
coinciden. 

En efecto, sea A una matriz semejante a la matriz B: 

A=XABX. 

Entonces para el polinomio característico de A tenemos 
DEA|=E=X"BX=IX"E—=8)X]=|X 1 JAE—=8B]-1X 1. 


Los determinantes |X”!] y |X| son números recíprocos cuyo 
producto es igual a la l; por esto, se tiene 


PE—B|=|E—A| 


que es lo que se quería demostrar. 

De este teorema se deduce, en particular, que /as matrices se- 
mejantes tienen trazos y determinantes iguales, ya que la traza y el 
determinante de una matriz, provistos de signo adecuado, son coe- 
ficientes de su polinomio característico. 

La igualdad de los polinomios característicos es una condición 
necesaria pero, como regla general, no suficiente de la semejanza 
de matrices. Por ejemplo, los polinomios característicos de las 


matrices 
e=[ot] s a=foi 


coinciden. Sin embargo, A no puede ser semejante a E ya que para 
cualquier matriz X se tiene 


X“EX=X-X =E. 
Las raíces del polinomio caracteristico de una matriz se llaman 
números característicos o valores propios de la misma. Las raíces 


múltiples del polinomio característico se llaman valores propios 
múltiples de la matriz. Es conocido que la suma de todas las raices 
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reales y complejas de un polinomio de grado n, cuyo coeficiente prin- 
cipal es la 1, es igual al coeficiente de la (1—1)-ésima potencia de la 
variable tomado con el signo contrario. De la fórmula (2) resulta, 
por ello, que en el cuerpo de los números complejos la suma de todos 
los valores propios de una matriz es igual a su traza. 

Observemos que la traza de una suma de matrices es igual a la 
suma de las trazas de los sumandos y que la traza del producto de 
un número por una matriz es igual al producto de este número por 
la traza de la matriz. Ambas afirmaciones pueden ser resumidas en 
una fórmula: 


traza («A + PB) =a- traza A + B-traza B 


para cuya demostración basta considerar las matrices correspondien- 
tes l calcular sus trazas. 
n el p. 1.2 a todo polinomio ọ/A} ha sido puesta en corres- 
pondencia una matriz oa) llamada /alor del polinomio (A) para 
=A. Si p(4)=0, se dice que Á e: raíz de (À). 

TEOREMA DE HAMILTON-CAYLEY. Toda matriz es raíz de su polino- 
mio característico. 

Sea A una matriz. Sea B la matriz adjunta de la matriz carac- 
terística AE— A (véase el p. 2.3). Sean By (i, j=1,2, ..., n) los 
elementos de la matriz B. Estos elementos son los adjuntos del 
determinante [AE— A| y, por lo tanto, representan polinomios en 
A de grado no superior a n—1. Sea 


By =B0 HPA BoA, 
Consideremos las matrices numéricas auxiliares 
AN BRI 


A A TN 


pepa. PR 
Es evidente que la matriz B puede ser representada en este caso 
en la forma siguiente: 


B= 


0 ABW p.. ABD, 


En virtud de la propiedad principal de las matrices adjuntas, se 
jene 


BQE—A)=|\E—A]-E. 6) 


Aquí |AE—A] es el polinomio característico de la matriz A que 
representaremos mediante ọ (À). Sea 


PAn HAt n Hana ATTA 
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Ahora podemos escribir la igualdad (3) en forma más detallada: 


(BOPABO CAB) (AE — A) = 
= (m+ aÀ... Han AnA) E. 


Suprimiendo los paréntesis y comparando los coeficientes de po- 
tencias iguales de A, obtenemos 
—BWA Bs 
IBwA+BO ZEE, 
IBoA}B™ ZE, 
gu p Bihia E, 
E. 


BUD = 


Multipliquemos a la derecha estas igualdades por E, A, ..., A", 
respectivamente, y sumémoslas. Todos los términos del primer 
miembro se anularán y obtendremos 


O=0E+ a A a AA A, 
es decir, p(4)=0 que es lo que se quería. 


3.3. Polinomio mínimo. Consideremos todos los polinomios no 
nulos F(A) para los cuales una matriz A dada es una raíz, Existen 
polinomios de este tipo; entre ellos figura, por ejemplo, el polino- 
mio característico de la matriz A. El polinomio no nulo de menor 
grado y de coeficiente principal igual a la 1, para el cual la ma- 
triz A es una raiz, se llama polinomio minimo de esta matriz. 

* Toda matriz A tiene sólo un polinomio mínimo. En efecto, si hubiese 
dos, digamos yp, (à) y wp¿(A), la diferencia yp, (A)—+, (4) sería un 
polinomio no nulo de grado menor, para el cual la matriz A tam- 
bién sería una raiz. Dividiendo esta diferencia por su coeficiente 
principal, tendríamos un polinomio de coeficiente principal igual 
a la 1, la matriz A sería una de sus raíces y su grado sería infe- 
rior al de los polinomios mi os Pp, (A) y p,(0), lo cual estaría 
en contradicción con la definición de los polinomios mínimos. 

Todo polinomio f(à) para el cual la matriz A es una raiz es 
divisible por el polinomio minimo (à) de esta matriz. 

Efectivamente, supongamos, al contrario, que f (4) no es divi- 
sible por (A). Designando mediante g(A) el cociente y mediante 
r(A) el resto de la división de f (à) por p(%), tendremos 

10M=90)90)+r 0). 

Tomando aquí =A y valiéndonos de que g= =o, 
obtendremos r(4)= Pero el grado del resto r (à) es menor que 
el grado del divisor (à). Por consiguiente, 7 (A) es un polinomio 
no nulo, la matriz A es su raíz y su grado es inferior al grado 
del polinomio mínimo +y(%), lo cual es contradictorio. Hemos 
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demostrado nuestra afirmación. En particular, el polinomio minimo 
de una matriz es un divisor de su polinomio característico, 

Sabemos que las matrices semejantes tienen un mismo polinomio 
característico. Esta misma propiedad la tiene el polinomi i 
las matrices semejantes tienen polinomios mínimos idénticos. En 
efecto, sea A semejente a B: A=X”1BX. Si f(A) es un polinomio 
que tiene a B como raíz, tendremos en virtud del p. 3.1 


HA) =HX"BX)=X="H(B)X =0. 


Por consiguiente, el conjunto de polinomios que tienen como raíz 
una de las matrices semejantes coincide con el conjunto de polino- 
mios que tienen como raiz otra de las matrices semejantes. Por 
esto, el polinomio de grado menor y de coeficiente principal igual 
a la l, perteneciente a este conjunto, será el polinomio mínimo de 
ambas matrices. 

La igualdad de los polinomios mínimos es una condición nece- 
saria más de la semejanza de matrices. Sin embargo, esta condición 
tampoco es suficiente. Consideremos por ejemplo, las matrices 


200 200 
A=[030| y B=|020|: 
003 003 


Sus polinomios característicos son iguales, respectivamente, a 
(AM—2(—3) y (—2*(—3). 


Puesto que estos polinomios son diferentes, las matrices Æ y 
B no son semejantes. El polinomio mínimo de la matriz A debe 
ser divisor de su polinomio característico, es decir, debe coincidir 
con uno de los polinomios siguientes: A—2, A—3, (A—3), 
(M—2)(4—3) o (A—2)(A—3). Tomando aquí en lugar de A la 
matriz A, encontraremos que el cero se obtiene por primera vez 
en el caso del polinomio (A—2)(A—3). Por consiguiente, este poli- 
nomio será precisamente el polinomio minimo de la matriz A, 
De la misma forma determinaremos que el polinomio minimo de 
la matriz B es también el polinomio (A—2) (4—3). Es decir, los 
polinomios minimos de las matrices A y B coinciden, mientras que 
las matrices A y B no son semejantes. 

En el p. 1.4 hemos dicho que las matrices de tipo 


TA, 7 
A, 
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donde Aj, .. 
en células A, 
células. 

El polinomio característico de una matriz descompuesta es 
igual al producto de los polinomios característicos de sus células 
diagonales. 


A, son matrices cuadradas, se llaman descompuestas 
., A, O descompuestas en la suma directa de estas 


En efecto, si A se descompone en células Ay, ..., Aj es fácil 
ver que su matriz característica es de la forma 
TAE, — A, g 
amA, 
AME—A= y 
t AE, —A,, 
donde E,, ..., E, son las matrices unidades de ordenes correspon- 


dientes. Se sabe del p. 2.1 que el determinante de una matriz des- 
compuesta es igual al producto de los determinantes de sus células 
diagonales. Por consiguiente, 


EA] =/2E,—A,|:AE,—Arl... AE, — A, 


que es lo que se queria demostrar. 

El polinomio mínimo de una matriz descompuesta es igual al 
minimo común múltiplo de los polinomios mínimos de sus células 
diagonales. 

Supongamos que la matriz A se descompone en las células 
Ar s.. Ap Sean pr (0), +. +, ps(%) sus polinomios mínimos res- 
pectivos. Consideremos un polinomio arbitrario f (@). Si f(4)=0, 
de la fórmula (7) del p. 1.4 resulta que f (4,) =- A 
Pero todo polinomio que tiene como raíz a la ma 
sible por el polinomio minimo y (+) de esta matriz. Por consiguiente, 


E: 


JG) es un común múltiplo de los polinomios 4). -+ 9.0): 
Viceversa, si un polinomio cualquiera f(A) es un común múltiplo 
de 1,0), <--> WA), se tiene evidentemente [(4)=0. Por consi- 


guiente, para oblener el polinomio mínimo de la matriz A es pre- 
ciso tomar el común múltiplo de menor grado de los polinomios 
(0), ---> ps (A), es decir, el mínimo común múltiplo, que es lo 
que se quería demostrar. 

Una matriz celular A se llama semidescompuesta o celular trian- 
gular, si todas sus células diagonales son cuadradas, mientras que 
las células que figuran a un lado cualquiera de la diagonal princi- 
pal están formadas por ceros. En lo sucesivo siempre aceptaremos 
que las células nulas de la matriz semidescompuesta se hallan 
sobre la diagonal principal. Por consiguiente, las matrices celulares 


5—1843 
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semidescompuestas tienen la estructura siguiente 


, 1) 


donde A, A,, son células cuadradas y todas las células que 
se hallan encima de éstas están formadas por ceros. 

Sea B otra matriz semidescompuesta cualquiera, cuyas células 
diagonales son del mismo orden que las células correspondientes de 
la matriz A. En virtud de las reglas de operación con matrices 
celulares, tenemos 


An Bn 

An As 4| 8n Bu sr 

An Aissi Aud. Ba Biúcsoo Dia 
Fat Bu 


de +Bn Ant Bas 
AntkBn Ant Bas 00 Arrt Bud 


AuB, 
u Br 
i An l | Ca À 4 
LAs Ass oee Ass e Bod COn Ca -e AssBss. 
donde C,,=AyBy + A;, j01Bjer, + -+ AuBy Por consiguiente, 
la suma y el producto de matrices semidescompuestas son matrices 
semidescompuestas cuyas células diagonales son iguales a las sumas 
y a los productos de las células correspondientes de las matrices dadas. 
En particualr, si f(A) es un polinomio en A y A es una matriz 
semidescompuesta de tipo (1), se tiene 
F 
] e 
FAs), 


(las células D,, tienen una estructura más compleja). Del $ 2 cono- 
cemos que el determinante de una matriz semidescompuesta es igual 
al producto de los determinantes de sus células diagonales. 

De aquí se deduce directamente que el polinomio característico 
de una matriz semidescompuesta es igual al producto de los polino- 
mios característicos de las células diagonales de esta matriz. 

Si las células de una matriz semidescompuesta A son de orden 1, 
se dice que A tiene forma triangular o, simplemente, que es una 
matriz triangular. Los valores propios de una matriz triangular son 
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iguales a sus elementos diagonales. De las fórmulas (2) resulta tam- 
bién que siendo E, be .... E, los valores propios de una matriz 
triangular, k valores propios de la matriz f(A) serán f(), 
(AS 


Ejemplos y problemas 


1. Una matriz se llama nllpotente si una de sus potencias es Igual a la 
matriz nula. Demuéstrese que una matriz semidescompuesta es nilpotente sí, 
y sólo si, son nilpotentes sus células diagonales. 

2. Empleando ei teorema de Hamilton-Cayley demuéstrese que si en el cuerpo 
de, los números complejos todos los valores propios de una matriz son Iguales 
a cero, la matriz es nilpotente. 

3. Demuéstrese que si en la suma directa de matrices se cambian entre sí 
los sumandos, la suma nueva será una matriz semejante a la suma inicial. 

4, Calcúlense los polinomios característicos y los valores propios de las 
matrices 

123 


cta Caza» e fii). 


5. Hállense los polinomios mínimos de las matrices 


2000 
310 200 
Sl 239) RRI 0:10 
03)» E y |0030] 
] 003)’ L003, 9003 
6. Demuéstrese que los valores propios de una matriz diagonal son sus ele- 


mentos diagonales. 
7 Demuéstrese la fórmula 


traza (AB) = trazo (BA). 


8. Si en una matriz cuadrada de orden n se suprimen m filas con los nů. 
meros is, i im Y m columnas con los mismos números, quedará una matriz 
de orden n—m y "su determinante se llama menor prin É 
Demuésitese que el coeficiente de hom en el polinomio característico de in matriz 
A es Mal a la suma de sus menores principales de orden n—m multiplicada 
por (==1)" =, 

G Bemutstrese que el polinomlo característico de la matriz AB coincide 
con el polinomio característico de la matriz BA. 

10, SÍ far Burpy yogs som los valores propios de una matriz A, los valores 
propias de la mairi F(À). donde f (à) es un polinomio, serán iguales a f (f), 
Cah n) 
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$ 4. Dimensión 


4.1. Módulos y espacios vectoriales. Un conjunto arbitrario no 
vacío de elementos Y se llama módulo sobre un anillo K, si se 
cumplen las condiciones siguientes: 

a) existe una regla que a partir de cualquier par de elementos 
a y b de £ permite hallar un elemento de Q que se llama suma 
de los dos primeros y se designa mediante a+b; 

b) existe una regla que a partir de cualquier número a de K 
y de cualquier elemento a de * permite hallar en £ un elemento 
nuevo que se llama producto de « por a y que se designa me- 
diante aa; 

c) las operaciones de adición y de multiplicación por número 
satisfacen los axiomas siguientes: 

1° la adición es conmutativa: 


a+b=b+a; 
2” la adición es asociativa: 
a+ (640) =(a40)+c; 
3° es posible realizar la sustracción, es decir, para todo par de 
elementos a y b de Q existe en £ un elemento x tal que 
a+x=b; 
4” la multiplicación es asociativa: 
a (Ba) = (a) a; 
5° la multiplicación es distributiva respecto a la adición en £: 
a(a+b)=00+ab; 


6” la multiplicación es distributiva respecto a la adición de 
números: 


(a+8)a=0a+ Ba. 
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Si el 'anillo K está provisto del elemento unidad 1, suele exi- 
girse que se cumpla además la condición 


T La=a (a€%). 


En este caso el módulo se llama unitario. Un módulo unitario sobre 
un cuerpo K se llama espacio lineal o vectorial sobre K. Los ele- 
mentos de los módulos y de los espacios vectoriales se llaman vec- 
tores y en lo que sigue se representan con letras latinas minúscu- 
las a, b, x, y, ... Los espacios lineales y los conjuntes de vecto- 
res se representarán con letras góticas mayúsculas Á, Y, L, M, ... 

En la definición dada más arriba los vectores se multiplican 
a la izquierda por los elementos del anillo K. Por esta razón, 
los módulos y espacios definidos más arriba se llaman tam: 
bién módulos a la izquierda y espacios a la izquierda sobre K. 
Si se exige que estén definidos los productos a la derecha de los 
elementos de por los elementos de K y si se modifican de 
modo correspondiente los axiomas de 4° a 7°, se obtendrá una es- 
tructura que se llama módulo a la derecha y, respectivamente, 
espacio lineal a la derecha. Está claro que las propiedades de los 
espacios a la izquierda y a la derecha son las mismas; tiene impor- 
tancia distinguir la multiplicación a la izquierda y a la derecha sólo 
cuando estén definidas simultáneamente, En lo que sigue los espa- 
cios a la izquierda sobre K se llaman simplemente espacios sobre K. 

Un espacio lineal sobre el cuerpo de los números complejos se 
llama espacio lineal complejo y un espacio lineal sobre el cuerpo 
de los números reales se llama espacio lineal real. Los ejemplos 
principales de módulos y de espacios lineales se darán más tarde, 
mientras que ahora consideraremos los corolarios más simples que 
se desprenden inmediatamente de los axiomas de 1% a 7°. 

Ante todo, la condición a) y los axiomas 2° y 3° muestran que 
todo módulo es un grupo respecto a la operación de adición de 
vectores y, además, según el axioma 1° este grupo debe ser con- 
mutativo. Por consiguiente, igual que en cualquier grupo conmuta- 
tivo, la suma de un número finito de vectores no depende ni del 
orden de los sumandos de esta suma ni de la forma en la que 
están dispuestos los paréntesis. Por ejemplo, 


(a+b) + (04d) =c+(a4 (d+b)). 

Además, entre los vectores de un módulo arbitrario existe, al 
igual que en todo grupo aditivo, un único vector—designémoslo 
mediante o—que posee la propiedad de que 

x+o=0+x=x 


cualquiera que sea el vector x del módulo considerado. El vector 
o se llama vector nulo o simplemente cero del módulo. Además, 
para todo vector a del módulo £ existe en el último un vector y, 
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y sólo uno, que satisface la ecuación 
a4y=0. 
Este vector y se indica por —a y se llama opuesto de a. 
De los axiomas 1”, 2? y 3*se desprende que —o=0 y que 
para cualesquiera a y b 
—(—aj=a y —(a+b)=(—a)+(—b). 


En las expresiones de tipo (— a) +b-+(—c) suelen omitirse los 
paréntesis escribiendo —a-+b—c. La operación binaria —, defi- 
nida mediante la fórmula 


x—y=x+(—y), 


se llama operación de sustracción de vectores. El hecho de que un 
mismo símbolo indica dos operaciones diferentes (la del paso al 
vector opuesto y la operación binaria de sustracción) no originará 
en lo sucesivo ningún inconveniente. 

Hasta el momento hemos considerado sólo aquellas propiedades 
de los módulos que los caracterizan por ser ellos grupos conmuta- 
tivos respecto a la adición, es decir, aquellas propiedades que se 
desprenden de los axiomas 1°, 2 y 3°. Teniendo en cuenta los 
axiomas de 4° a 7°, obtenemos fácilmente las identidades 

0-a=0, 

ma=a+a+... +a 
(m sumandos; m es un número entero positivo), 
(—a)-a = — (aa), 

a00. 

En efecto, la primera es consecuencia de que 
a=(1+0)ja=1-a4+0-a=a+0-a; 

la segunda se demuestra de modo siguiente: 


ma=(14...+la=1.a+...+1a=a+4...+a. 
Luego, puesto que 
0a+(—aja=(a—a) a=0, 


se tiene (—a)a=-— (aa). Finalmente, la cuarta igualdad es conse- 
cuencia de que 
a-o+a0=a(0+a)=0a. 


Observemos también que, siendo K un cuerpo, de aa=0 se deduce 
que o bien a=0 o bien a=0. En efecto, si a 0, multiplicando 
la relación «a=0 por a”! obtenemos a=0, 
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Las expresiones de tipo 


20,+0,0,+... +0, 
se llaman combinaciones lineales de los vectores a, Aj, ..., a, De 
nuestras consideraciones se desprende que las combinaciones linea» 
les pueden ser sumadas, restadas y multiplicadas por números y 
que en ellas se pueden reducir los términos semejantes siguiendo 
las reglas habituales. 

El ejemplo más conocido de un espacio lineal es el conjunto de 
los segmentos orientados que parten de un punto fijo O de nuestro 
espacio habitual. Multiplicar un segmento por un número real po- 
sitivo æ significa aumentar su longitud œ veces sin alterar su di- 
rección. Si œ es negativo, la multiplicación de un segmento por a 
significa que su longitud aumenta |æļ| veces y que su dirección 
cambia por la contraria. Análogamente, sumar dos segmentos sig- 
nifica tomar la diagonal del paralelogramo construido a partir de 
estos segmentos. El vector nulo será el segmento, cuyo origen y 
extremo coinciden con el punto O. Puesto que la operación de 
multiplicación de un segmento por un número está definida sólo 
para los números reales, el campo principal K es en este caso el 
cuerpo de todos Jos números reales y el espacio de segmentos orien- 
tados es un espacio lineal real. Lo llamaremos siempre espacio de 
vectores-segmentos corrientes y lo indicaremos por R. 

Un ejemplo más general de espacios lineales, y además básico 
para toda la teoria de los mismos, es el espacio de filas. Conside- 
remos el conjunto de todas las sucesiones de tipo [%,, %, ..., %), 
donde %,, ..., %, son números de un cuerpo K y n es un número 
entero dado. También llamaremos estas sucesiones filas, considerán- 
dolas como matrices compuestas de una fila. Dos filas se llaman 
iguales si son iguales sus elementos respectivos. Las operaciones de 
adición de fitas y de multiplicación de filas por un número se de- 
finen mediante, las fórmulas matriciales correspondientes: 


Bian ..., %]=[Ba, . 
lar Gar onis On] + Br, 
atp AEB... 
Está claro que en este caso los axiomas de 1° a 7° se cumplen y 
que el conjunto de todas las filas de longitud n formadas por 
elementos de un cuerpo K es un espacio lineal sobre K. Siendo K 
un anillo cualquiera, obtenemos un ejemplo de un módulo sobre K. 

En lugar de filas se pueden considerar matrices de un número 
cualquiera, pero fijo, de filas y de columnas con elementos de un 
anillo K. De acuerdo con las reglas del cálculo de matrices, cual- 

uier matriz de este tipo puede ser multiplicada por un número de 
k y cualesquiera dos pueden ser sumadas, obteniéndose ambas ve- 
ces una matriz del mismo tipo. Es obvio que los axiomas de 1° a 
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7° también se cumplen aquí y, por consiguiente, las matrices de m 
filas y de n columnas constituyen, respecto a las operaciones de 
adición y de multiplicación por número, un módulo sobre K o un 
espacio lineal, si es un cuerpo. 

Consideremos un ejemplo más. Sea M un conjunto arbitrario de 
cualesquiera elementos y sea K un anillo. Supongamos que tene- 
mos a nuestra disposición una ley que pone en correspondencia a 
cada elemento m de M un número determinado de K. Toda ley de 
esta índole se llama función definida sobre el conjunto WM y con 
valores en K. Si la función se indica con una letra cualquiera f, 
mediante f(m) suele indicarse el número que corresponde al ele- 
mento m. El número f(m) se Mama valor de la función f sobre el 
elemento m. Dos funciones f y g que satisfacen la igualdad f(m)= 
=g(m) cualquiera que sea m de W, se llaman iguales. Para las 
funciones definidas sobre Mi se pueden introducir de modo habi- 
tual las operaciones de multiplicación por número, de adición y de 
multiplicación de funciones. Por ejemplo, dados un número a y 
una función f y poniendo en correspondencia a cada elemento m 
de Mi el número af (m), obtenemos una función nueva que se llama 
producto del número « por la función f. Análogamente se definen 
la suma y el producto de dos funciones. Si consideramos sólo las 
dos primeras de estas operaciones —la multiplicación por número 
y la adición— es fácil ver que se cumplen los axiomas de un mó- 
dulo. Por consiguiente, el conjunto de todas las funciones, defini- 
das sobre un conjunto dado M y con valores en un anillo K 
constituye un módulo sobre K. Siendo el anillo inicial un cuerp 
obtenemos, al igual que anteriormente, un ejemplo de espacio vi 
torial.. 

En el caso en que M consta de un número finito de elemen- 
tos, se puede introducir una notación cómoda para las funciones 
definidas sobre M. Sean m, mM, ..., m, los elementos del con- 
junto M. Indiquemos mediante (m,] la función que es igual a 1, sob- 
rem, e igual a O sobre todos los demás elementos de M (i=1, ..., 
<.. 5). En estas condiciones el producto æ fm,} será la función 
igual a œ sobre m, e igual a 0 sobre todos los demás elementos 
de M y la expresión 


a [m] +0, (m)+... +4, [m,] 0) 
será, obviamente, la función que es igual a a, sobre m, a A, SO- 
bre m, ..., a a sobre m, Por consiguiente, toda función defini- 


da sobre Wt puede ser representada en la forma (1) y esta repre- 
sentación, como es fácil ver, es única. Si no existe el peligro de 
confusión, los paréntesis en (1) suelen omitirse y en lugar de (1) 
suele escribirse brevemente: 


QM, +0 My + -Hasy 
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con la particularidad de que los términos de coeficientes nulos no 
se escriben. Por ejemplo, si Wè se compone de las letras a, b y c, 
la expresión 2a—c significa la función que es igual a 2 sobre a, 
a cero sobre b y a —l sobre c. 


Dependencia_lineal. Sea $ un espacio vectorial sobre un 


cuerpo de coeficientes K y sean a, ap ..., Am unos vectores de 
este espacio. La relación de tipo 


A A 


donde 2, ..., % son números de K, se llama relación de depen- 
dencia lineal entre los vectores a, ..., Am. Si todos los coeficien- 
tes %, ..., dy son iguales a cero, la relación se llama trivial. 
En el caso contrario, es decir, si al menos uno de los coeficientes 
es diferente de cero, la relación se llama no trivial. Está claro que 
una relación trivial existe entre cualesquiera vectores. La respuesta 
a la pregunta sobre si existe o no una relación no trivial, depen- 
de de los vectores que se consideran. Por ejemplo, en el espacio de 
filas de longitud tres entre los vectores a=[1, 4, 6), b=(1,—1, 1 


y c=[1, 1, 3] existe la siguiente relación de dependencia linea 
2a+3b— 50 = 0. 

Por otra parte, en este mismo espacio no existe ninguna relación 

no trivial entre los vectores e,=[l, 0, 0), e={0, 1, 0] y 


e,=[0, O, 1) ya que la relación 
ae ae, aj =0 


(%, an» as] = [0, O, 0], 


significa que 


de donde se tiene 
a =a =a, =0. 


Un sistema finito de vectores a,, a, ..., a, de un espacio lineal 
se llama linealmente dependiente, si enire ellos existe una relación 
no trivial. 

Si no existe tal relación, es decir, si de toda relación de tipo 

aata, t.. H Anan = 0 
se deduce que a, ==. 
llama linealmente independiente. 

De esta definición se deduce inmediatamente que si a un siste- 
ma linealmente dependiente de vectores a, a, ..., a, Se agregan 


otros vectores b,, by, el sistema ampliado seguirá siendo lineal- 
mente dependiente. En efecto, si 


Ay + 050 + 


An=0, el sistema a, ap ..., ap Se 


Haa 
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es una relación no trivial entre a, ..., am, tendremos que 


A+. Hanan + 0-by+. de b,=0 
erica rencia no Aval Ent as by. 

En los problemas relacionados con la a “Tineal el vec- 
tor nulo o ocupa una posición especial debido a que todo sistema 
que contenga el vector nulo es linealmente dependiente. Para de- 
mostrar esta afirmación basta observar que la relación 

1040-07... +0-07=0 
es una relación no trivial cualesquiera que sean a, ... 

La definición que hemos dado de dependencia lineal Er un sis- 
tema presupone que dicho sistema contiene un número finito de 
vectores. Sin embargo, resulta necesario, con frecuencia, considerar 
también sistemas infinitos. Diremos que un sistema infinito de vec- 
tores es linealmente dependiente, si resulta linealmente dependiente 
alguna parte suya finita. El siguiente ejemplo muestra que pueden 
existir sistemas infinitos lineal aie independientes de vectores. 
Consideremos el conjunto de todos los polinomios en letra A con 
coeficientes de un cuerpo K. Respecto a las operaciones de adición 
y de multiplicación por números de K, estos polinomios forman, 
evidentemente, un espacio lineal. Los polinomios 


114,2 E] 


constituyen un sistema linealmente independiente en este espacio. 
Efectivamente, cualquier parte finita suya 


E Ame 
((0<m < m, <... < my) 
es linealmente independiente, ya que de 
mm adm = 0 
se deduce que 0,=%,=...=0%% y 
Consideremos un espacio lineal arbitrario Y. Si un vector a de 
este espacio puede ser representado en la forma 


4=0,0,+0,0,+... Hanin 


se dice que a se expresa linealmente en términos de a, Gp ..., an 
o que a depende linealmente de Q,,..., an 

Si los vectores Q,, ..., Gp Se expresan. linealmente en términos 
deb, ..., Dn Y bp b, se expresan linealmente en téminos de 
so » Cp, los vectores A ».. Ap se expresan linealmente en términos 

Enea je 

Para la demostración basta en las expresiones lineales de los vectores 
Aj, ..., 4, en términos de b, ..., Ò, sustituir bn, ... bẹ por sus 


expresiones en términos de c, ... 


cp y reducir los términos seme- 
jantes. 
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TEOREMA 1. Si un sistema de vectores no nulos a, decida: e 
considerados en un orden determinado es linealmente dependiente, al 
menos uno de estos vectores puede ser expresado linealmente en tér- 
minos de los anteriores. Reciprocamente, si uno de los vectores de 
esta sucesión se expresa linealmente en términos de los anteriores, el 
sistema es linealmente dependiente. 

Supongamos que entre los vectores ap, Q,, ..., G, existe una 
relación no trivial 


A +04... aN =0. a) 


Sea a el último coeficiente diferente de cero. Si k=1, la relación 
(1) se convierte en 


aa=0 (4,0), 


de donde a,=0 a pesar de haber aceptado que el sistema no con- 
tiene vectores nulos. Por consiguiente, 1<k<m y la relación (1) 
puede ser representada én la forma 
a+... +00 =0 (0% 7 0), 

de donde se tiene 

a= — A A — + — AR O mp 
Con esto queda demostrada la primera parte del teorema. La afir- 
mación recíproca es evidente. 

Sea M un conjunto de vectores de un espacio lineal €, Un 
sisteme de vectores a,, az, ... de este conjunto se llama sistema de 
generadores de Mi, si todo vector de M puede ser expresado lineal- 
mente en términos de un número finito de los vectores a,, s, ... 
Un sistema linealmente independiente de generadores de se llama 


base del conjunto M. Por ejemplo, en el espacio de todos los poli- 
nomios en A los polinomios 


DRM da aa (2) 


constituyen una base ya que estos polinomios, como hemos visto, 
son linealmente independientes y, por otro lado, todo polinomio es 
de la forma 


AFA, 


es decir, se expresa linealmente en términos de l, A, ..., A, 

LEMA Si un sistema de generadores a, G,, ... de un conjunto 
M contiene un elemento a, que puede ser expresado linealmente en 
términos de los demás generadores, entonces suprimiendo a, en el 
sistema de generadores se obtiene de nuevo un sistema de generado- 
res de M. 

En efecto, por hipótesis todo vector de M es una combinación 
lineal de un número finito de generadores. Sustituyendo en estas 
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combinaciones el vector a; por su expresión en términos de los 
demás generadores obtendremos para cualquier elemento de M una 
expresión en términos de los generadores diferentes de a, que es lo 
que se quería demostrar. 

Teorema 2. De todo sistema de generadores de un espacio & se 
puede extraer una base de este espacio. 

Supongamos que @ tiene un sistema finito de generadores 


Az, 4, ..., Gp, Omitiendo en este sistema todos los vectores que se 
expresan linealmente en términos de los anteriores, obtendremos un 
sistema de vectores ai, Gi» ... Gi que, de acuerdo con el lema, 


será aun un sistema de generadores del espacio £. Puesto que nin- 
gún vector de este último sistema puede ser expresado linealmente 
en términos de los anteriores, este sistema es, en virtud del teore- 
ma 1, linealmente independiente y, por lo tanto, es una base del 
espacio. 


Hemos demostrado el teorema 2 aceptando que el sistema de generadores 
contiene un número finito de elementos. Sin embargo, este teorema es válido 
También en el caso de un sistema infinito de generadores. Para la demostración 
es suficiente disponer los generadores en una sucesión translinila dy, aa, > ++ Qw» 
O o qy oitir en ella todos los elementos que se expresan Mnetimente en 
términos de los anteriores. 


Sea a, 4, ... una base del espacio £. Según la definición de 
una base, todo vector de L se expresa linealmente en términos de 
un número finito de vectores básicos. Demostremos que esta repre- 
sentación es única. En efecto, sea 


2=0,0,+ 040,4... +00, 


a=P0+B10,+... H Bels 
Restando obtenemos 


o=(a,—P)a +(0,—P,)0a,+... + (2s — B) 0s 


Como a,, a, ... son linealmente independientes, se tiene a, —P,=0, 
a—P,=0, a,—B,=0, es decir, a, =f,, ..., 4,=P,, que es 
lo que se quería demostrar. 

i un espacio lineal £ tiene al menos una base compuesta por 
un número finito de elementos, se dice que € es de dimensión finita. 
Con más detalle, £ se llama de dimensión finita si se puede escoger 
en £ un sistema linealmente independiente finito de vectores, tal, 
que todos los vectores de £ se expresan linealmente en términos 
de este sistema. 

El concepto de base no se puede aplicar al espacio nulo. Sin 
ambargo; aceptaremos que el espacio nulo es también de dimensión 
inita. 

TEOREMA 3. Todas las bases de un espacio lineal no nulo & de 
dimensión finita constan de un mismo número finito de vectores, Este 


y sea 
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número se llama dimensión del espacio Y. La dimensión del espacio 
nulo es, por definición, el número cero. 

Según la definición, en Y existe una base que consta de un 
número finito de vectores. Sea 


Cris N (3) 


esta base. Demostremos que el número de vectores de otra base 
cualquiera 


a a 
no puede ser mayor que n. En efecto, consideremos el sistema 
Xar Qas Ags o Op (5) 


Puesto que el sistema (3) es un sistema de generadores de Q, es 
decir, todo vector de £ se expresa linealmente en términos de los 
vectores (3), también el sistema (5) tendrá esta propiedad. Sin 
embargo, el sistema (5) es linealmente dependiente, ya que su primer 
vector x, puede ser expresado linealmente en términos de los res: 
tantes. Aplicando a la sucesión (5) el teorema 3, vemos que uno 
de los vectores de esta sucesión, digamos a,, debe expresarse lineal 
mente en términos de los anteriores. Omitiendo en (5) el vector a, 
obtendremos una sucesión nueva 


Kar Ais ees Ahar- (6) 


donde aj, ..., Qs... representan aquellos de los vectores a, ..., ap 
que hemos conservado, En virtud del lema, el sistema (6) será aun 
un sistema de generadores de £. Consideremos ahora la sucesión 


(7) 


Esta sucesión es linealmente dependiente debido a que el vector x, 
se expresa linealmente en términos de sus elementos restantes. Por 
consiguiente, de acuerdo con el teorema 1 uno de los vectores de 
este sistema debe expresarse linealmente en términos de los anterio- 
res, Este vector debe ser sólo uno de los vectores ai, ..., @n-u ya 
que x, y x, son, por hipótesis, linealmente independientes. Omi- 
tiéndolo de la sucesión (7), obtenemos la sucesión 


So a 


AE ooo Opon (8) 


donde ai, ..., An- son aquellos de los vectores ai, ..., ahı que 
hemos conservado. Puesto que la sucesión (7) era un sistema de 
generadores de £, también la sucesión (8) será, en virtud del lema, 
un sistema de generadores de £. Agregando ahora a la sucesión (8) 
el vector x,, omitiremos de la nueva sucesión el vector que se ex 
presa linealmente en términos de los anteriores, etc. Si el número 
de vectores x; fuese mayor que z, al cabo de z pasos obtendriamos 
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una sucesión 


A A 0) 
que no contendria los vectores au -.., an y que seria un sistema 
le generadores de £. Esto significaria que todos los vectores del 


espacio £ podrían ser expresados linealmente en términos de los 
vectores (9). En particular, también el vector x,., podría ser ex- 
presado linealmente en términos de los vectores (9), lo que estaría 
en contradicción con la independencia lineal de los vectores x,, x,, 
Por consiguiente la base (4) no puede contener más vectores que 
la base (3), es decir, todas las bases de Y constan de un número 
finito de vectores. Por otro lado, la base (3) ha sido escogida arbi- 
trariamente. Por lo tanto, con nuestro razonamiento queda demos- 
trado que el número de vectores de una base no puede ser inferior 
al número de vectores de otra base, es decir, todas las bases de Q 
tienen un mismo número de vectores. 

TEOREMA 4. Cualquiera que sea un sistema linealmente indepen- 
diente a, ..., Gn de vectores de un espacio £ de dimensión finita, se 
puede encontrar en & unos vectores A+, ..., A, tales, que el sistema 
Mp «> Gas Gras a, sea una base de Q. 

DEMOSTRACIÓN. :ojamos en £ una base cualquiera x, Xy... 
X, y consideremos la sucesión 


Oys Gp a my Xis Xar 0 Xm (10) 


Omitamos ahora en esta sucesión todos aquellos vectores que se ex- 
presan linealmente en términos de los anteriores. Puesto que a, 
Mw, ... Aa son linealmente independientes, no será omitido ninguno 
de ellos y el sistema que resulte será de la forma 


Marco Om Kip oeer Ko (01) 


Debido al teorema 1 este sistema es linealmente independiente, Por 
otra parte, todos los vectores del espacio Y podían ser expresados 
linealmente en términos del sistema (10). En virtud del lema, la 
misma propiedad la debe tener también el sistema (11). Por con- 
siguiente, el sistema (11) es una base del espacio L y Xi, Xi, o>., Xi 
son los vectores que queríamos encontrar. 

El teorema 4 puede ser enunciado también en esta forma: todo 
sistema linealmente independiente de vectores del espacio £ o bien es 
una base o bien forma parte de una base de L. 

Supongamos que £ es de dimensión n. Entonces, toda base del 
espacio £ contiene n vectores y, por consiguiente, el número de 
vectores en cualquier sistema linealmente independiente de Y es 
o menor de n o igual a n. En el último caso el :istema debe ser 
una base de Q. En particular, el número máximo de vectores lineal- 
mente independientes de L es igual a n, es deci, es igual a la 
dimensión de £. 
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Hemos obtenido el teorema siguiente. 

TEOREMA 5 Todo sistema de n+1 vectores de un espacio lineal Y 
de n dimensiones es linealmente dependiente. Cualesquiera n vectores 
linealmente independientes de este espacio constituyen una base del 
mismo. El número máximo de vectores linealmente independientes del 
espacio Y es igual a la dimensión de este espacio. 

Para concluir, observemos que los teoremas 3 y 4, que hemos 
enunciado para el caso de espacios de dimensión finita, tienen lugar 
también en los espacios de dimensión infi- CA 
nita. Solamente en lugar del número de A 
vectores de una base habrá que considerar la 
potencia del conjunto de los vectores que 
la componen y, respectivamente, la dimen- 
sión de un espacio deberá entenderse como 0 a 
la potencia del conjunto de vectores que 1 
forman una base cualquiera de este espa- a 
cio. En cuanto al teorema 5, solamente la + 
última de sus afirmaciones puede ser exten- a 
dida directamente al caso de dimensión 
infinita. En este libro estudiaremos las Pig do 

ropiedades de los espacios de dimensión 

inita. Por esto, en lo sucesivo un espacio lineal se comprenderá, 
siempre que no se diga lo contrario, como un espacio lineal de di- 
mensión finita. 

Determinemos la dimension de los espacios considerados en el 
p.4.1. Sea X el espacio habitual de segmentos orientados que parten 
de un punto O. Como de costumbre, diremos que estos segmentos 
son vectores, Demostremos que cualesquiera tres vectores ay, A, Y Ay 
del espacio R, que parten del punto O y que no pertenecen a un 
mismo plano, constituyen una base de Ñ. En efecto, los vectores 
ü, a, y a, son linealmente independientes, ya que de lo contrario 
uno de ellos, digamos a,, debería expresarse linealmente en térmi- 
nos de los otros dos. Sin embargo, la relación 0, = oa, -+-0a, sig- 
nifica que a, es la diagonal del paralelogramo construido a partir 
de los vectores oa, y dst. Puesto que aya, y aa, se hallan en el 
plano a,Oa,, también a, tendria que pertenecer al mismo plano, lo 
que estaría en contradicción con la hipótesis. Por otra parte, todo 


vector Å del espacio R puede ser expresado linealmente en térmi- 
nos de a, a, y a, (fig. 1): 


DA=0P,+P,P,+P,A=a,0, -+ 4,0, + 040 


donde a; es la relación entre la longitud del segmento P,..,P, (P, =0, 
P,=A) y la longitud de a, tomado con el signo adecuado. Por 
consiguiente, a, a, y a, es una base del espacio N y des de 
dimensión tres. 
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Análogamente se demuestra que el conjunto de vectores, que 
parten de un punto O y que pertenecen a un plano que pasa por O, 
es un espacio lineal de dos dimensiones y que el conjunto de vecto- 
res, que parten de O y que pertenecen a una recta que pasa por O, 
es un espacio de una dimensión. 

Consideremos el espacio de filas de longitud n formadas por 
elementos de un cuerpo K. Sea 


Multiplicando sucesivamente estas filas por números arbitrarios 


Qp y + a, y sumando, obtenemos 

RR AAA An) 
Es decir, una fila arbitraria [Q, ..., a,] se expresa linealmente en 
términos de €,, ..., €». Sin embargo, el sistema e, ..., €, es line- 


almente independiente, debido a que la relación 
ae hate... + =0 


a 5 =[0, 0, ..., 0], 


de donde se tiene a¿=,=. , =0. Por ello, e, ep ..., €, es 
una base del espacio considerado y, por consiguiente, su dimensión 
es n, 

Finalmente, sea £ el espacio de funciones definidas sobre un con- 
E finito M y con valores en un cuerpo K. Sean m,, My, .-., My 
los elementos de M. Según el p. 4.1, toda función f de £ puede ser 
representada en la forma 


=a (m]+0,.[m]+...+0,(m,], 
donde [m;] es la función igual a 1 sobre m, e igual a O sobre los 


demás elementos del conjunto M. Es decir, f se expresa linealmente 
en términos de [m,], ¡m,]. Por otro lado, la igualdad 


a, [m] +0, (m4... +2. (m.] =0 


significa que todos los valores de la función que figura en el pri- 
mer miembro son iguales a cero y, por consiguiente, %=...=%,=0, 
Vemos de esta forma que [m,], -.., [m.,] es una base del espacio Y 
y que su dimensión es igual a s. 

Hemos considerado espacios lineales es decir, módulos (unitarios) 
sobre un cuerpo K. Ejemplos muy sencillos permiten ver que para 
los módulos sobre anillos arbitrarios, e incluso sobre anillos conmu- 
tativos arbitrarios, los teoremas 1 y 2 dejan de terier lugar. Sea, 
en particular, K el anillo de los números enteros corrientes y sea Y 


implica 
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to de estos mismos números enteros en el que la operación 
n está definida del modo corriente y la operación de multi- 
plicación de «números» de K por «vectores» de Q está definida como 
la multiplicación habitual de números enteros. Convendremos en 
indicar los números enteros que representan los vectores de £ con 
cifras gruesas, mientras que los números de K se indicarán con cifras 
corrientes. Puesto que para cualquier vector rs es válida la fórmula 
m=m-1, 
nuestro módulo numérico resulta ser generado por el vector 1. 
Los vectores 2 y 3 son linealmente dependientes, ya que 
2.34(—3)-2=0. 

Sin embargo, para cualquier «€ K se tiene a-34%2 y a-2%3, es 
decir, en £ ninguno de los vectores 2 y 3 se expresa linealmente en 
términos del oo: Las propiedades de los módulos sobre anillos 
arbitrarios son estudiadas sistemáticamente en la teoría de los mó- 
dulos, estrechamente ligada a la teoría de los números. Para nosotros, 
en cambio, tendrán interés solamente las propiedades de los espacios 
vectoriales y tocaremos la teoría de los módulos sobre anillos sólo 
cuando esto sea necesario para la teoria de los espacios vectoriales. 


4.3. Isomorfismo. El concepto de espacio lineal tiene dos facetas 
esencialmente diferentes. En primer lugar, un espacio lineal es un 
conjunto de ciertas entes que se denominan vectores y, en segundo 
lugar, en un espacio lineal actúan las operaciones de adición y de 
multiplicación por número. Por esto, o bien podamos limitarnos a 
estudiar qué es lo que representan los vectores y cuáles son la na- 
turaleza y las propiedades de los mismos, o bien podemos tomar 
otro punto de vista y estudiar las propiedades de las operaciones 
indicadas independientemente de la naturaleza de los elementos con 
los cuales se efectúan estas operaciones. En lo sucesivo nos intere- 
sarán solamente las propiedades del segundo género. Por ello, dos 
espacios de la misma estructura respecto a las operaciones de adición 
y de multiplicación por número se considerará que tienen las mismas 
propiedades o que son isomorfos. Con más precisión el concepto de 
isomorfismo puede enunciarse del modo siguiente: 

Dos espacios lineales sobre un mismo cuerpo de coeficientes se llaman 
isomorfos, si se puede establecer una correspondencia biyectiva entre 
sus elementos, tal que a la suma de vectores del primer espacio co- 
rresponda la suma de los vectores correspondientes del segundo espacio 
y al producto de un número por un vector del primer espacio co- 
rresponda el producto de este mismo número por el vector correspon- 
diente del segundo espacio. 

Toda correspondencia biyectiva que posee las propiedades indi- 
cadas se llama isomorfa o isomorfismo. Consideremos las propiedades 
elementales de los isomorfismos. 

61843 
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En una correspondencia isomorfa el vector nulo corresponde al 
vector nulo. En efecto, supongamos que en una aplicación isomoría 
de un espacio lineal $ sobre otro espacio lineal £, el vector a de & 
corresponde al vector a, de £,. Entonces, según la definición de 
un isomorfismo, el producto 0-a debe corresponder al producto 0-a,, 
es decir, el vector nulo del primer espacio debe transformarse en el 
vector nulo del segundo espacio. 

En una aplicación isomorfa un sistema de generadores del primer 
espacio se transforma en un sistema de generadores del segundo espacio. 

Efectivamente, sean a, a, ..., a, unos generadores del primer 
espacio y sean b,, ba, ..., b, los vectores que les corresponden en 
el segundo espacio. Tomemos en el segundo espacio un vector ar- 
bitrario b pd el vector a del primer espacio que le cor- 
responde: r hipótesis, el vector a puede ser representado en la 
jorma 


2=0,0,+0%,0,+... H Osag. 


Según la definición de una aplicación isomorfa, la suma 2,0,+-. . .-+a,0, 
debe transformarse en la suma a,b, +... +a,b, y, por consiguiente, 
el vector b debe coincidir con la suma a,b, +... -+0%sb,, es decir, 
los vectores bj, ..., b, constituyen un sistema de generadores del 
segundo espacio. 

En un isomorfismo los vectores linealmente independientes se trans- 
forman en vectores linealmente independientes. 

En efecto, supongamos que los vectores linealmente independien- 


tes a, a, ..., Am del primer espacio se transforman en los vectores 
Br bas = -ns Op del segundo espacio. Supongamos que entre los últimos 
existe una relación de tipo 


Bib, + Bab, +- - < + Baba = 0. 


Según la definición de un isomorfismo, al primer miembro de 
esta igualdad corresponde en el primer espacio el vector fa, + P,a, + 

m.. +Baân y al vector nulo o, corresponde en el primer espacio 
el vector nulo o. Por consiguiente, 


Ba +B0+...+Bn0a 


Puesto que los vectores a,, .. .. a, son linealmente independientes 
se tiene 
B,=P,=...=BP,=0, 


es decir, los vectores b,, ..., b. son linealmente independientes. 

De las dos propiedades últimas se deduce directamente que en 
un isomorfismo una base de un espacio lineal se transforma de nuevo 
en una base de un espacio lineal y, por consiguiente, los espacios 
lineales isomorjos tienen la misma dimensión. 
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La afirmación recíproca es también válida: si dos espacios lineales 
sobre un mismo cuerpo de coeficientes tienen la misma dimensión, son 
isomorfos. 

Para la demostración tomemos una base cualquiera en cada uno 
de los espacios dados, por ejemplo, a ys ..., a, Y by Op +., bne 
Diremos que los vectores 


a= l, 40044... dy 


b= Bibit Bib, o- H Babn 


son correspondientes, si a, =P,, ..., %n=PB,. Puesto que todo vector 
de un espacio se expresa linealmente en términos de una base de 
un modo único, nuestra correspondencia es biyectiva. Sean ahora 


a= am, + 00,4 ++. H aln 


baap tab, +.. + anba 
dos vectores correspondientes. Entonces se tiene 


aa= aam + 000, +... + Anan 


ab = aab, +urby+... +00 q 


Puesto que en estas descomposiciones coinciden los coeficientes res- 
pectivos, los vectores aa y ab serán correspondientes, es decir, en 
nuestra correspondencia el producto de un número por un vector se 
transforma en el producto del mismo número por el vector corres. 
pondiente. Análogamente se demuestra que la suma de vectores se 
transforma en la suma de vectores correspondientes. Por esto, la 
correspondencia construida es un isomorfismo, que es lo que se quería 
demostrar, 

Las propiedades de las correspondencias isomorías que hemos 
enunciado muestran que fijado el cuerpo principal K todo espacio 
lineal queda determinado, salvo un isomorítsmo, por su dimensión. 
Por esta razón, los espacios de filas de longitud n con elementos 
“de un cuerpo K, donde ne»1, 2, ..., agotan, salvo isomorfismos, 
todos los espacios de dimensión finita sobre K. En particular, el 
espacio habitual de segmentos orientados es isomorío al espacio de 
filas de longitud tres Sobre el cuerpo de los números reales, el es- 
pacio de funciones definidas sobre un conjunto A, compuesto por s 
elementos, y con valores en un cuerpo K es isomorfo Aj espacio de 
filas de longitud s con elementos de K, etc. 


y 


y 


Para concluir hagamos una observación más. En el Algebra 
peñan un papel principal el concepto de álgebra de signatura di 
de isomorfismo de álgebras de signatura determinada, Én la definici 


neral desem- 


el concepto 
òn que hemos 


ce 


84 Cap_ 11 Espacios lineales 


dado del concepto de módulo no se ha indicado, desde el punto de vista formal, 
la signatura del módulo, es decir, no se han señalado las operaciones que se 
consideran como principales y respecto a las cuales se define el concepto de 
isomorfismo. Definiendo fal igual que para los espacios lineales) el concepto de 
isomorfismo de módulos, fijamos con ello el conjunto de las operaciones princi- 
pales, aunque de un modo implícito. Indicando estas operaciones explicitamente, 
obtenemos la siguiente definición de módulo unitario que sólo en la forma dificre 
de la definición del p. 4.1 

Se ilama módulo unitario sobre un anillo K con el elemento unidad } un 
álgebra cuya signatura se compone del símbolo + de una operación binaria y 
de los simbolos — y Fa (a EX) de operaciones de una posición siempre que en 
este álgebra se cumplan las identidades 


$ rymy +H; 

© x+ (y+) (xy) Hz 
HA) = 

F, (Fa (0))= Fag (a): 

F, (0+b)=F, (0) +F, ( 
Fazola) = F, (a) +F; (a); 
: F, (=a. 


Por consiguiente, la multiplicación de los elementos del conjunto principal 
(de los vectores) por cualquier elemento fijo EX se considera aquí como unn 
operación principal independiente. Si el anillo principal K es infinito, la signa- 
tura del módulo es también infinita. Cambiando el anillo K, cambiamos también 
la signatura de la de módulos Š 

Èxiste, en general, otra forma de incluir la teoria de módulos en la teoria 
general de álgebras. Para ello los módulos se consideran como álgebras compues- 
las de dos conjuntos principales: el conjunto de los números y el conjunto de 
los vectores. La signatura consta ahora de las operaciones de adición de números, 
de paso al número opuesto, de adición de vectores, de paso al vector opuesto, 
de multiplicación de un número por un vector y de la operación O-aría que des- 
peja la unidad 1 (en total seis operaciones). Las identidades principales son en 
este caso las identidades que definen un anillo, las identidades que definen un 
grupo conmutativo y las identidades de 4° a 7% del p. 4.1. 

Este nuevo concepto de módulo es diferente del anterior. Todos los módulos 
tienen, en el sentido nuevo, una misma signatura (las seis operaciones indicadas) 
y por esto resulta posible preguntar si son o no isomorfos unos módulos defini- 
dos sobre distintos anillos. Estos isomorfismos nuevos suelen llamarse, en dife- 
rencia de los definidos anteriormente, antiisomorfísmos. En este orden de ideas 
se definen también los anfiautomorfísmos y los antiendomorfismos y otros con- 
ceptos análogos. 


Ejemplos y problemas 


1. Demuéstrese que la dimensión del espacio de todos los polinomios en una 
varlable de grado mo mayor que n es igual a n+1. 

2. Los polinomios homogéneos en dos variables de grado a constituyen un 
espacio lineal de dimensión n-+1 

3. ¿Cuál es la dimensión del espacio de los polinomios homogénegs en k 
variables de grado n? 

4. Las matrices de m filas y de n columnas formadas por elementos de un 
cuerpo dado K constituyen un espacio lineal respecto a las operaciones usuales 
matriciales de adición y de multiplicación por número. Demuéstrese que las 
matrices en las que un elemento es igual a la unidad y todos los demás ele- 


$ 5. Coordenadas 85 


mentos son iguales a cero, constituyen una base de este espacio y que, por 
consigujente, la dimensión de este espacio es igual a mn, 

.. Las matrices simétricas, asi como las matrices antisimétricas, de orden n 
formadas por elementos de un cuerpo K constituyen unos espacios lineales sobre K 
setn ya 


Demuéstrese que las dimensiones de estos espacios son iguales a 


a, respectivamente. 
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5.1. Coordenadas de un vector. En el parágrafo anterior hemos 
considerado las propiedades generales elementales de los espacios 
lineales. Sin embargo, en las aplicaciones, además de conocer las 
propiedades generales, es importante saber definir los vectores en 
términos de números y poder reducir las operaciones vectoriales a 
operaciones con números. Este problema se resuelve introduciendo 
las coordenadas de un espacio vectorial. 

Toda base de un espacio lineal £, cuyos vectores se toman en 
un orden determinado, se llamará base de coordenados o sistema de 
coordenadas de Q. Por consiguiente, si 
» An 0) 
es un sistema de coordenadas de £, estos mismos vectores, pero to- 
mados en otro orden, representarán otro sistema de coordenadas de 


£, Hemos visto que todo vector a de £ puede ser representado uní- 
vocamente en la forma siguiente: 
a= aa, H t,t o +0 An (2) 

Los números œ, ..., a, se llaman coordenadas del vector a en el 
sistema de coordenadas (1). La fila (œ, œs ..., a,) compuesta por 
las coordenadas del vector a, tomadas en un orden adecuado, se 
llama fila de coordenadas y se indica por [a]. Por consiguiente, una 
vez escogido en el espacio un sistema de coordenadas determinado, 
a todo vector corresponde una fila de coordenadas y, viceversa, para 
toda fila de longitud n se obtiene con la fórmula (2) un vector de- 
terminado a, para el cual esta fila es su fila de coordenadas. 

Supongamos que [æ ..., a) y IB, ..., Ba] son las filas de 
coordenadas de los vectores a y b, es decir, 


a=00,+2%0,+... +0, 


A, Ap, 


y 
b=Ba+B0 4. -- + Brane 
Es evidente que 


aa =(00,) 0, + (201) 04 + > -- +(0%p) an 
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atd=(a+P)a+(0,+B)0,+... H (An + Bn) ane 


Empleando las reglas de operaciones con filas, estas igualdades pue- 
den ser representadas en la forma 

[ua] =a [a] y [a+b] = [a] + [b]. 
Por consiguiente, la fila de coordenadas de una suma de vectores es 
igual a la suma de las filas de coordenadas de los sumandos y la fila 
de coordenadas del producto de un número por un vector es igual al 
producto de este número por la fila de coordenadas del vector. 

Este resultado puede ser interpretado de la forma siguiente. 
Sea £ un espacio lineal de dimensión n sobre un cuerpo K. Sea Y, 
el espacio de filas de longitud n formadas por elementos de K. 
“Tomemos en £ un sistema de coordenadas determinado y pongamos 
en correspondencia a todo vector de £ su fila de coordenadas. Nuestro 
resultado significa qas esta correspondencia es un isomorfismo entre 
£ y £,. En particular, de aquí se desprende que los vectores line- 
almente independientes tienen filas de coordenadas linealmente inde- 
pendientes y que toda relación de dependencia lineal entre los vectores 
dados tiene lugar también para las filas de coordenadas de los mismos. 

En un mismo espacio Y existen diferentes sistemas de coorde- 
nadas. Por esto surge la pregunta: ¿cómo varían las coordenadas de 
un vector al cambiar un sistema de coordenadas por otro? Para re- 
solver este problema, tomemos en £ dos sistemas de coordenadas 

<» 4, y Qi, az, ...,a, cualesquiera. Puesto que los vectores 
. a, constituyen una base de £, los vectores a; ..., ap deben 
rse linealmente en términos de a, ..., a,. Sean 


E A H Tinni 
Aj æ T0, + Toy H © > E Tons 


a= Tp, HT, + E Tona 


esta» expresiones. La matriz 


To Sre Tin 

Ta Ta Ta Tan 

Tar Tag +++ Tun 
se llama matriz del cambio del sistema de coordenadas a,, ..., dy 
por el sistema de coordenadas a;...., 2; Tomemos un vector a 
cualquiera y sean [%,, --.. æn) y [æi +... œn] sus filas de coor- 


denadas en los sistemas antiguo y muevo de coordenadas. Es decir, 
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tenemos a=0,0,+0,0,+... +00, 
v 


amaia; Haia +... + A 
Tomando en la segunda de estas igualdades en lugar de los vectores 
aj, ..., an sus expresiones en términos de aj, ..-, Gp obtenemos 
a= (aitat Tat -e LT) y HATH ++ + H AT) ++ 
es decir 


a, maita H Ta H o e Epa 
Tra HTa o + a 


E » -F Ah Tan 


Estas igualdades son precisamente las fórmulas de transformación 
de coordenadas que buscábamos. Observando que la expresión para aj: 


a= aiT Tut- H Ahn 
representa el producto de la fila de coordenadas [a;, ..., an] por 
la i-ésima columna de la matriz 7, vemos que todo el sistema de 


las fórmulas de transformación de coordenadas puede ser represen- 
tado breyemente en la forma matricial: 
[%, ++ 2%)]=[0%, ..., 95)7. 

Hemos obtenido la siguiente regla: 

REGLA DE TRANSFORMACIÓN DE COORDENADAS. La fila de coordena- 
das antigua de un vector es igual a la nueva multiplicada por la 
matriz del cambio. 

Demostremos el siguiente lema que en muchas ocasiones resulta 


útil. 

Lema. Sean A y B dos matrices cuadradas de orden n formadas 
por elementos de un cuerpo K. Si para cualquier fila [$,, ..., Èn] 
de elementos de K resulta 

En <<< E A=[Ej, +... En] B, (3) 

se tiene A=B. h ] , l t 
En electo, sean œ los elementos de la matriz A y sean Bj 
los elementos de la maltiz B(i, j=1, ..., n); entonces cualquiera 


que sea i para E¡=1 y E,=0 (124 j) de la igualdad (3) resulta que 
an= bi (i, k=1, ..., n), que es lo que se quería demostrar. 
Consideremos 'ahora en un espacio lineal 2 de n dimensiones 
dos sistemas de coordenadas a,, a, y ai, Podemos 
expresar o bien aj, ..., a, en tér 


4) 
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o bien, al contrario, a, a, en términos de dí, ..., aj 


a, 


La matriz T, formada por los coeficientes 1,, es la matriz del 


cambio del sistema a, » An por el sistema aj, ..., a, y la 
matriz S, formada por los coeficientes 0, es la matriz del cambio 
recíproco del sistema ai, ..., a; por el sistema a, ..., a, Sea 
[x) la fila de coordenadas de un vector cualquiera x en el sistema 
de coordenadas a, ..., a, y sea [x], la fila de coordenadas del 
vector x en el sistema aj, ”..., a4. Considerando que a,, ..., ay es 
el sistema antiguo y aplicando la regla de transformación de coor- 
denadas, obtenemos 

kx] =[x],7- (5) 
Al contrario, considerando que el sistema antiguo es aj, ..., am 
tendremos 

[h= [x] S. 


Tomando aqui en lugar de [x] su expresión (5), obtenemos 
Lx], =[x], TS 


[x] = (x] ST. 


Aqui el vector x y, por consiguiente, sus filas de coordenadas [x], 
y [x] son arbitrarias. En virtud del lema, obtenemos entonces 


E=TS=ST y S=T>=, 


Es decir, la matriz de la transformación de coordenadas siempre 
posee la inversa que es la matriz de la transformación recíproca 
de coordenadas. 

Nuestros razonamientos permiten aclarar un detalle relacionado 
con las matrices inversas que hemos dejado sin consideración en el 
p. 2.3. Según el p. 2.3, una matriz cuadrada S se llama inversa de 
la matriz T, si se cumplen dos igualdades: 


ST=E y TS=E. 


Si S satisface sólo la primera o sólo Ja segunda de estas igualda- 
des, se dice que es inversa a la izquierda y, respectivamente, inversa 
a la derecha. 

TEOREMA Si una matriz cuadrada T formada por elementos de 
un cuerpo K posee la matriz inversa a la izquierda o a la derecha S, 
la matriz S es simplemente la inversa de T. 

Tomemos un espacio £ de n dimensiones con una base cualquiera 
41, ++ -+ Oy. Calculemos según las fórmulas (4) los vectores 0%, ..., az. 


y de forma análoga 
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Demostremos que son linealmente independientes. Sea 
A+... +A pa=0. 
Es obvio que esta relación equivale a la condición matricial 
[a +, A]:T=0. (6) 
Si T posee la matriz inversa a la derecha S, multiplicando a la 
derecha ambos miembros de la igualdad (6) por S y observando 
que TS=E, obtenemos [Ay ..., An]=0. Por consiguiente, los 
vectores ai, ..., a, son linealmente independientes y el sistema 
a, ..., an puede ser considerado como un nuevo sistema de coor- 
denadas” de Q, con la particularidad de que la matriz T será la 
matriz del cambio. La matriz del cambio posee la matriz inversa 
. Multiplicando la relación TS==E a la izquierda por T=, 
obtenemos S=7T”!, Hemos demostrado que una matriz inversa a la 
derecha es simplemente la matriz inversa. Análogamente se demues- 
tra que una matriz inversa a la izquierda es también simplemente 
la inversa. 
De los razonamientos realizados se desprende, en particular, que 
toda matriz invertible de orden n es una matriz del cambio de 
determinados sistemas de coordenadas. 


5.2. Rangos de matrices. Consideremos un espacio lineal £ de 
dimensión finita n sobre un cuerpo K. Tomemos en @ una base 


cualquiera a,, ..., 4, a título del sistema de coordenadas y supon- 
gamos que los vectores x, ..., Xa tienen respectivamente las si- 
guientes filas de coordenadas 

Lx] = [> +.» n] 


Sabemos ya que el número máximo de vectores linealmente inde- 
pendientes en el sistema xı, ..., x, €s igual al número máximo 
de filas linealmente independientes €n el sistema [x], -.-; [xa], 
es decir, coincide con el número máximo de filas linealmente 
independientes de la matriz A. 

El número máximo de filas linealmente independientes de una 
matriz arbitraria, A, formada por elementos de un cuerpo dado K, 
se llama rango de la matriz A, o, con más precisión, rango según 


las filas. a 
De este modo, el número máximo de vectores linealmente’ inde- 
pendientes entre los vectores x, ..., x, es igual al rango de la 


matriz formada por las filas de coordenadas de estos vectores. 
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Volvamos a considerar una matriz arbitraria A de m filas y de 
n columnas, Escojamos en A cualesquiera % filas y k columnas. 
Los elementos de la matriz A, que se hallan en los cruces de estas 
filas y columnas, tomadas en su orden natural, forman una matriz 
cuadrada de orden k, que se llama menor de orden £ de la matriz A. 
Considerando todos los menores de primero, segundo, etc. órdenes, 
de la matriz A, podremos ver que una parte de los mismos serán 
matrices invertibles y otra parte, matrices no invertibles. El orden 
máximo de los menores invertibles de la matriz A se llama rango 
de la misma según los menores o rango de menores. 

Los menores de primer orden son los elementos de la matriz A. 
Puesto que la matriz A se toma sobre un cuerpo, el hecho de que 
un menor de primer orden no sea invertible significa simplemente 
que este menor está formado por el número cero. Luego, una 
matriz A no posee menores invertibles si, y sólo si, está compuesta 
de ceros. En este caso se dice que el rango de menores de la ma- 
triz A es igual a cero. Observemos que el rango según las filas de 
la matriz nula es también igual a cero, ya que un sistema de vectores 
nulos no posee subsistemas linealmente independientes. Pretendemos 
demostrar ahora que el rango según las filas de una matriz arbi- 
traria coincide con su rango de menores. Antes de obtener este resul- 
tado, consideremos las matrices cuadradas. 

TEOREMA 1 Para que una matriz cuadrada A= |] c;;|lan, formada 
por elementos de un cuerpo K, sea invertible es necesario y Suficiente 
que sus filas sean linealmente independientes. 

Sea a; (i=1, ..., n) la iésima fila de la matriz. Entonces 
toda relación de dependencia lineal 

Aart... +4,0,=0 a) 
entre las filas de la matriz Æ puede ser representada en la forma 
D oas An] A=0. 2) 

Siendo la matriz A invertible y multiplicando ambos miembros 
de la igualdad (2) por A”, obtenemos [A,, ..., A,]=0 y con esto 
queda demostrado que las condiciones del teorema 1'son necesarias. 

Recíprocamente, supongamos que las filas a,, ..., a, de la matriz 
A son linealmente independientes. Sea L el espacio vectorial de 
ay as filas de longitud n formadas por elementos del cuerpo K. 

as filas 


r e, =[0, 0, ..., 1] 
constituyen una base de £. Por otra parte, el espacio £ es de n 


dimensiones y, por hipótesis, los vectores Aj, . 


sā, son lineal- 
mente independientes. Luego, los vectores Ay, .. 


n forman también 
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una base del espacio Q. Considerando la base e, €, como el 
sistema de coordenadas inicial en & y la base a, A, como un 
nuevo sistema de coordenadas, vemos que A es la matriz del cambio 
del primer sistema de coordenadas por el segundo y que, por con- 
siguiente (véase el p. 5.1), la matriz A es invertible. 

COROLARIO. El determinante de una matriz cuadrada, formada por 
elementos de un cuerpo conmutativo, es igual a cero si, y sólo si, las 
Filas de esta matriz son linealmente dependientes. 

Efectivamente, para matrices cuadradas, formadas por elementos 
de un cuerpo conmutativo, la invertibilidad equivale a la regularidad, 
es decir, a que el determinante de la matriz sea diferente” de cero. 

Tomando ahora en consideración la observación hecha al princi- 
pio de este punto, vemos que un sistema de n vectores de un espa- 
cio vectorial de n dimensiones sobre un cuerpo conmutativo forma 
una base de este espacio si, y sólo si, es diferente de cero el deter- 
minante de la matriz formada por las filas de coordenadas de los 
vectores indicados. 

El teorema 1 y su corolario tratan de las filas de una matriz. 
Sin embargo, estas proposiciones son válidas también para las 
columnas,. siempre que la expresión «relación de dependencia lineal 
de columnas» sea interpretada como una relación de dependencia 
lineal respecto a la multiplicación a la derecha de las columnas 

or los elementos de K. Por ello, siempre que no se diga lo contrario, 

multiplicación de filas por elementos de K significará la multi. 
plicación a la izquierda de las filas por los elementos, mientras 
que la multiplicación de columnas por elementos de K significará 
la multiplicación a la derecha. Está claro que este convenio sobra 
si K es un cuerpo conmutativo, Para el caso de cuerpos K no con- 
mutativos el convenio aceptado es de importancia. 

Es fácil comprobar que todos los razonamientos que hemos 
empleado para demostrar el teorema 1 permanecen válidos si la 
palabra «fila» es sustituida en los mismos por la palabra «columna». 
Así obtenemos el resultado siguiente. 

TEOREMA la Para que una matriz cuadrada, formada por elemen- 
tos de un cuerpo, sea invertible es necesario y suficiente que sus 
columnas sean linealmente independientes. El determinante de una 
matriz cuadrada, formada por elementos de un cuerpo conmutativo, 
es igual a cero si, y sólo si, las columnas de la matriz son lineal- 
mente dependientes. 

Es evidente que si se consideran matrices sobre un cuerpo con- 
mutativo, el teorema la se obtiene del teorema 1 pasando simple- 
mente a la matriz transpuesta. 

TEOREMA 2. Sea A= |]a llan una matriz cualquiera formada por 
elementos de un cuerpo K. Los rangos de la matriz A según las filas, 
las columnas y los menores no varían si A se somete a una de las 
transformaciones siguientes: 
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a) se cambian entre si cualesquiera filas de la matriz A; 

b) s cambian entre si cualesquiera columnas de la matriz A; 

c) se suman a los elemenios de una de las filas de la matriz A 
los elementos correspondientes de otra fila cualquiera multiplicados a 
la izquierda por un factor arbitrario fijo A€ K; 

d) se suman a los elementos de una de las columnas de la matriz A 
los elementos correspondientes de otra columna cualquiera multiplica- 
dos a la derecha por un factor arbitrario €K. 

El rango de la matriz A según las filas es igual al número 
máximo de elementos linealmente independientes en el conjunto de 
sus filas a, ..., Gp. Al cambiar el orden de las filas de A sólo 
alteramos la numeración de las últimas; pero los conceptos de 
dependencia o independencia lineal de vectores no están relacionados 
con la numeración. Así mismo, está claro que el rango de la matriz A 
según las filas no varía al cambiar sus columnas. En efecto, sean 
bı» .»., On las filas de la matriz nueva obtenida después del cambio 
de columnas. Supongamos que entre las filas de la matriz A existía 
una relación de dependencia lineal 4,0,-+... +Am4p=0; es evidente 
que las filas nuevas verificarán la relación análoga A,b,+...-+Amby"=0 
y que, viceversa, la última relación implicará la anterior. Lo mismo 
ocurrirá si a una columna cualquiera de la matriz A se agrega otra 
columna multiplicada a la derecha por A. Finalmente, el número 
máximo de filas linealmente independientes no cambiará si la ¡-ésima 
fila de la matriz A es sustituida por la fila a,-+2a, ya que los 
vectores del sistema a, ..., 4424) ..., Ap ..., Am Se expresan 
linealmente en términos de los vectores a, ..., a, y los vectores 
del último sistema se expresan linealmente en términos de los 
vectores del primer sistema. 

Hemos visto que el rango de la matriz A según las filas no 
varía en las transformaciones indicadas en el teorema. Razonamientos 
análogos demuestran que el rango de la matriz A según las colum- 
nas no varía en las transformaciones a), b), c) y d). Pasemos ahora 
a demostrar que tampoco varía el rango de la matriz A según los 
menores, lo cual requerirá una mayor atención. 

Supongamos que en la matriz A se cambian entre si cuales- 
quiera filas o columnas. En este caso los menores de la matriz 
nueva se obtienen de los menores de la matriz antigua mediante 
cambios de filas o columnas y sólo debemos comprobar que al 
cambiar filas o columnas en una matriz invertible de nuevo obte- 
nemos una matriz invertible. 

Supongamos, pues, que en una matriz cuadrada B=||B;,[l.. se 
han cambiado entre sí la primera y la ¿-ésima filas. El cálculo 
directo deja constancia de que la matriz nueva puede ser represen- 
tada en la forma DB, donde 


DEL + Ente Eino ia H Ent Er at +++ Y Esr 
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Aquí E; es la matriz cuyo elemento de la iésima fila y j-ésima 
columna es la unidad, mientras que todos los demás elementos 
suyos son ceros. Mediante cálculo directo podemos comprobar que 


DD=E y D`=D. 


Por esto, si la matriz B tiene inversa, la matriz B-D será la 
inversa de DB. Análogamente, la matriz BD se obtiene de B 
cambiando entre sí la primera y la ¿-ésima columnas. Si B 
Pep Aeae; la matriz BD también tiene la inversa, a saber, 
DB- 


Hemos demostrado que el rango de menores no varía al cambiar 
entre sí filas y columnas. Supongamos que el rango de menores de 
B es igual a r y que a la ¡-ésima fila de B se ha agregado la 
j-ésima fila multiplicada por A. Por hipótesis, la matriz B posee 
un menor invertible de orden r perteneciente a r filas y a r columnas 
determinadas. Para no complicar sin necesidad la notación, acep- 
temos que este menor pertenece a las r filas primeras y a las r 
columnas primeras de la matriz B. Si la ¿-ésima fila que se altera 
no pertenece a las r primeras filas, el menor indicado de orden r 
continuará siendo un menor de la matriz nueva. Por esto el rango 
de la matriz nueva es >r. Supongamos que la ¡-ésima fila es una 
de las r primeras filas. Consideremos los elementos de las matrices 
nueva y antigua que se encuentran en las r primeras columnas, en 
las r primeras filas y en la j-ésima fila (j >r). Obtendremos las 
matrices 


En virtud del teorema 1, las primeras r filas de la matriz P son 
linealmente independientes y, por ello, el rango de P según las 
filas es igual a r, De acuerdo con lo demostrado, de aquí se deduce 
que el rango de la matriz Q según las filas es también igual a r. 
Las primera, ..., (¡—l)-ésima, (¿+ 1)-ésima, ..., r-ésima filas de 
la matriz Q son desde luego linealmente independientes, ya que 
forman parte del sistema linealmente independiente de las r primeras 
filas de la matriz Q. Por esto, obien las 7 primeras filas de la matriz Q 
son linealmente independientes o bien la ¿-ésima fila se expresa 
linealmente en términos de las restantes y, por consiguiente, son 
linealmente independientes las restantes r filas de la matriz Q. En 
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otras palabras, uno de los menores 


F Bn «Br 7 

Piiira eia Bio: 
O | Biana eee Birne 

e aede 

E Ba oebe a 


de la matriz Q está formado por filas linealmente independientes. 
En virtud del teorema 1, este menor es invertible y el rango de 
menores de la matriz Q es no menor de r. 

Hemos demostrado que la transformación de tipo c) no dismi- 
nuye el rango de menores de una matriz. Pero, si la matriz C se 
obtiene de la matriz A agregando a su i-ésima fila la j-ésima fila 
multiplicada q A, la matriz A s obtiene de C sumando a la 
iésima fila de la matriz C su j-ésiria fila multiplicada por —A. 
En una y otra transformación los rangos de menores no disminuyen y, 
pe consiguiente, no varían. Resta considerar el caso de la trans- 
formación d); Pero, para ella la invariabilidad del rango de la 
matriz A se demuestra de la misma forma que la invariabilidad 
en la transformación c). 

Del teorema 2 mediante razonamientos sencillos se deduce el 
siguiente teorema principal. 

TEOREMA 3 (SOBRE EL RANOO DE UNA MATRIZ). Para una matriz 
arbitraria A=|)0,, Ilan, formada por elementos de un cuerpo, el rango 
según las filas, el rango según las columnas y el rango según los 
menores coinciden. 

La proposición es evidente si todos los elementos de la matriz 4 
son iguales a cero. Por esto, supondremos que A contiene un ele- 
mento a; diferente de cero. Cambiando entre sí la primera y la 
iésima flias y la primera y la ¡-ésima columnas de la matriz A, 
obtendremos una matriz B=||P,,|] en la que BP, =0,,7*0 y, ade 
más, en virtud del teorema 2, los tres rangos de la matriz B serán 
iguales a los rangos correspondientes de la matriz A. Sumando 
ahora a la segunda, ..., m-ésima filas de la matriz B su primera 
fila multiplicada a la izquierda por —Ba ps A 
respectivamente, obtendremos una matriz de tipo 


Biz Bas >> Bin 
Cie O Ya --- Yan, 


ô Yas >>> Yan! 


con la particularidad de que los tres rangos de la matriz C, serán 
los mismos que los de la matriz A. Si todos los y; son iguales 
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a cero, no realizamos ninguna transformación más. En cambio, si 
yy 0, (i>2, ei cambiamos entre sí la segunda y la i-ésima 
filas J la segunda y la j-ésima columnas de la matriz C,, obtenien- 


do así una matriz en la que el elemento y,, sea diferente de cero. 
Sumando entonces a la tercera, ..., m-ésima filas la segunda fila 
multiplicada por —Ya VR, ---» —VYar?r?, respectivamente, obten- 
dremos una matriz de tipo 

Fön Sua ôs Su 

O Ön Ôn ô, 


Cy=|0 0” Sn 0o. u| (618,70). 


00 05 rt 


Los rangos de la matriz C, también coincidirán con los rangos 
correspondientes de la matriz A. Continuando este proceso, al cabo 
de je número de pasos no mayor que m, obtendremos una matriz 
le tipo 


> Bar ropa ee Pan) 
20. Bar Barsi +0 Man 


+ Brr Bres 
00 


Jona (ir >> Brr 0), 


cuyos rangos coincidirán también con los rangos correspondientes 
de la matriz A. Sin embargo, de la forma de la matriz C, se de- 
duce directamente que los tres rangos de esta matriz son iguales 
a un mismo número r. Por esto, los tres rangos de la matriz A 
también tienen un mismo valor r. 

En el p. 2.3 se ha demostrado que una matriz cuadrada con 
elementos de un cuerpo conmutativo es invertible si, y sólo si, 
tiene el determinante diferente de cero. Por esto, para matrices 
sobre un cuerpo conmutativo el teorema 3 se puede enunciar del 
modo siguiente: 

TEOREMA 3a. En toda matriz con elementos de un cuerpo conmuta- 
tivo el número máximo de filas linealmente independientes es igual 
al número máximo de columnas linealmente independientes e igual 
al orden máximo de sus menores de determinante diferente de cero. 

La determinación práctica del rango de una matriz se realiza 
generalmente aplicando el método indicado en la demostración del 
teorema 3 o alguna de sus modificaciones convenientes. 
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Con frecuencia resultan útiles las dos observaciones siguientes 
que se deducen directamente del teorema 3. 

TEOREMA 4. Cualesquiera que sean dos matrices A=I|G;yllan Y 
B=1By Je con elementos de un cuerpo arbitrario el rango del pro- 
ducto AB es no mayor que el rango de la matriz A y no mayor 
que el rango de la matriz B. 

Efectivamente, de la definición del producto se ve que las filas 
de la matriz AB son combinaciones lineales de las filas de la 
matriz B y, EE consiguiente, el número máximo de filas linealmente 
independientes de la matriz AB no puede pasar del número máximo 
de filas linealmente independientes de la matriz B. Análogamente, 
las columnas de la matriz AB son combinaciones lineales de las 
columnas de la matriz A y, por consiguiente, el rango de la mat- 
riz AB ún las columnas es no mayor que el rango según las 
columnas de la matriz A. 

TEOREMAS Si los elementos de la matriz A pertenecen a un 
cuerpo conmutativo, su rango coincide con el rango de la matriz 
transpuesta A'. 

Todos los menores de la matriz A’ se obtienen por transposición 
de los menores de la matriz A. Puesto que los elementos de los 
menores se toman en un cuerpo conmutativo, de la transposición 
de un menor invertible resulta un menor invertible y, por consi- 
guiente, el rango (según los menores) de la matriz A’ coincide con 
el rango (según los menores) de la matriz A. 

En los Paa de la pág. 101 se da un ejemplo de una matriz 
invertible, formada por elementos de un cuerpo no conmutativo, 
cuya matriz transpuesta no es invertible. 


5.3. Sistemas generales de ecuaciones lineales. Consideremos un 
cuerpo K y un sistema arbitrario de ecuaciones de tipo 


Qni H Aabi + + H anën = Bas 


a) 
Om Hambat Eten = Bas 


donde œ; y $; son elementos dados de K y E, Em ..., Èn son 
incógnitas, cuyo número z puede ser mayor, menor o igual al 
número m de ecuaciones. En el p. 2.4 ha sido expuesto uno de 
los algoritmos de la resolución de estos sistemas, el método de 
eliminación de incógnitas. El teorema sobre el rango de una ma- 
triz, demostrado en el punto anterior, ofrece un acceso diferente 
al estudio de los sistemas de ecuaciones lineales. 

Los coeficientes œ y los términos independientes B, de las 
ecuaciones (1) se pueden disponer de un modo natural formando 


dos matrices: 
ar A + Oan} AAA 
A al, 
Gm na -> an | Vas 000 an Ba 


llamadas matriz principal y matriz ampliada del sistema (1). A toda 
ecuación del sistema (1) corresponde una fila determinada en las 
matrices A y B. El intercambio de ecuaciones en el sistema (1) 
lleva al intercambio correspondiente de filas en las matrices A y B 
y la modificación de la numeración de las incógnitas lleva al in- 
tercambio de columnas en las matrices indicadas. 

Se dice que la i-ésima ecuación del sistema (1) depende lineal- 
mente de las ¿,-ésima, . iyésima ecuaciones de este sistema, 
si la iésima fila de la matriz B es una combinación lineal de sus 
iyésima, ..., i,-ésima filas. Puesto que el cuerpo K no se supone 
conmutativo, las filas de las matrices se multiplican por elementos 
de K siempre a la izquierda, mientras que las columnas, a la 
derecha (véase el p. 5.2). 

Se llama solución del sistema de ecuaciones (1) una sucesión 
g, » El de elementos del cuerpo K que al ser introducidos en las 
ecuaciones (1) en lugar de las letras E,, ..., E, hacen válidas todas 
las igualdades. Si disponemos los elementos E,, ..., E, en una 
columna [E ..., E)’ =x, el sistema (1) puede ser representado 
en la forma matricial 


A-x=b, (2) 


donde b es la columna [B,, ..., Bn)” de los términos independientes, 

A) Si la iésima fila de la matriz B es una combinación lineal 
de sus restantes filas, entonces suprimiendo en el sistema (1) la 
iésima ecuación obtendremos un sistema reducido de ecuaciones que 
tiene el mismo conjunto de soluciones que el sistema (1). 

Está claro que toda solución del sistema (1) es también una solución 
del sistema reducido. Recíprocamente, supongamos que la i-ésima 
fila de la matriz B es igual a la suma de las ¿,-ésima,..., ¿,-ésima 
filas multiplicadas a la izquierda, respectivamente, por los elemen- 
tos Mr +... Ap de K(i i, is) y supongamos que los valores 

se, ES satisiacen las i-ésima, ..., i-ésima ecuaciones de (1). 
Enoc multiplicando estas ecuaciones a la izquierda por ^, ... Ass 
respectivamente, y sumándolas término por término, obtendremos 
la ¡-ésima ecuación. 

B) Si el rango (según las filas) de la matriz B es igual a r, 
el sistema de ecuaciones (1) contiene un subsistema de r ecuaciones 
linealmente independientes que posee el mismo conjunto de soluciones 
que el sistema (1). 


71843 
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Puesto que el rango de la matriz B es igual a r, la matriz B 
posee r filas linealmente independientes y todas sus filas restantes 
se expresan linealmente en términos de éstas. Tomando las ecuacio- 
nes que corresponden a las r filas linealmente independientes se- 
Maladas, obtendremos el subsistema deseado. 

C) Si el sistema de ecuaciones (1) tiene una solución E, ..., ES, 
el rango de la matriz ampliada B coincide con el rango de la matriz 
principal A. 

Si las igualdades (1) son válidas para ES, ..., Ẹ$, esto demuestra 
que la última columna de la matriz B es igual a la suma de sus 

rimera, ..., n-ésima columnas multiplicadas a la derecha por 
t, - +, En, respectivamente. Por esto, el número máximo de columnas 
linealmente independientes de la matriz B es igual al número má- 
ximo de columnas linealmente independientes de la matriz A, es 
decir, el rango según las columnas de la matriz B es igual al rango 
según las columnas de la matriz A. Las palabras «según las columnas» 
pueden ser omitidas, ya que en el p. 5.2 se ha demostrado que el 
rango según las columnas coincide con el rango según las filas. 

De las proposiciones B) y C) resulta fácilmente el siguiente 
teorema principal. 

TEOREMA DE KRONECKER—CAPELLI. 1) Para que el sistema de ecua- 
ciones (1) tenga solución, es necesario y suficiente que el rango de 
la matriz ampliada sea igual ai rango de la matriz principal de 
este sistema. Si los rangos de las matrices principal y ampliada 
coinciden con el número de incógnitas, el sistema tiene una solución 
única. Si el rango r de las matrices principal y ampliada es inferior 
al número n de incógnitas, el sistema (1) tiene más de una solución 
y es equivalente a un sistema de tipo 


TS TI t Yo ) 


(3) 


donde (ip... ip In-,) es una permutación adecuada de 
los números 1, 2, 

En otras palabras, en el último caso entre las incógnitas E, ...., En 
se pueden escoger n—r incógnitas Ey, ..., Ey,_,, llamadas libres, 
y dándoles valores arbitrarios de K se pueden encontrar para las 
restantes incógnitas unos valores únicos que satisiagan el sistema (1). 

La necesidad de las condiciones se deduce de la proposición C). 
Supongamos, por esto, que los rangos de las matrices A y B coin- 
ciden y son iguales a r. La matriz A contiene un total de n colum- 
nas, de modo que z< n. Por hipótesis, la matriz A posee un 


') En algunos libros españoles este teorema se conoce como el teorema de 
Rouché— Frobenius. (N. del Tr.) 
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menor invertible M de orden r (véase el p. 5.2) que pertenece 
a las Rjésima, ..., késima filas y a las iésima, ..., ¿-ésima 
columnas de la matriz A. De aquí se deduce que la k-ésima, ..., 
la k,ésima filas de la matriz B son linealmente independientes, 
mientras que sus filas restantes son combinaciones lineales de las 
filas señaladas. Por esto, dejando solamente la £,-ésima, ..., la 
k,:ésima ecuaciones del sistema (1) y suprimiendo {odas las demás 
ecuaciones, obtendremos un sistema reducido que tendrá las mismas 
soluciones que el sistema (1). Dejando ahora en los primeros miem- 
bros de cada una de las ecuaciones del sistema reducido los térmi- 
nos que contienen las incógnitas Ej, ..., Es, y pasando al otro 
miembro todos los demás términos, llevaremos el sistema reducido 


a la forma 
[En Es 4 
-J= |. a) 
tad La! 
donde 
1 = + + — tal (8= 1) 002, 0. 


Por hipótesis, el menor M es una matriz invertible. Multiplicando 
ambos miembros de la igualdad (4) a la izquierda por M”1, obte- 
nemos 


E, e 
A 


E, Lo, 


Realizando la multiplicación en el segundo miembro, llegamos al 
sistema de tipo (3). El teorema queda demostrado. 

El sistema de ecuaciones (1) suele llamarse determinado, inde- 
terminado y contradictorio según tenga, respectivamente, solución 
única, más de una solución y no tenga solución. Notemos que de 
acuerdo a esta terminología un sistema, que no es determinado, es 
o bien indeterminado o bien contradictorio. 

COROLARIO 1. Si el número de ecuaciones del sistema (1) es inferior 
al número de incógnitas, el sistema (1) es o bien indeterminado o bien 
contradictorio. 

COROLARIO 2. Un sistema de n ecuaciones lineales con n incógnitas 
es delerminado si, y sólo si, la matriz principal de este sistema es 
invertible. 

Ambos corolarios se desprenden directamente del teorema de 
Kronecker —Capelli. 


7 
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Hemos considerado el sistema de ecuaciones lineales (1) en el 
que los coeficientes aparecen a la izquierda de las incógnitas. ¿Qué 
puede decirse acerca del sistema de ecuaciones 


Erta H Estay H e + + H En = Bao 


Esla + Ésa + + + H En = Ba 


en el que los coeficientes figuran a la derecha de las incógnitas? 
Este sistema puede ser representado en la forma matricial 


Bo +++ Bh A= [Bu Bn]. 


donde A=|]a;}] es la matriz de los coeficientes de las incógnitas 
en el sistema (5). Prestemos atención a que en la matriz A los 
coeficientes de la ¡-ésima ecuación forman la ¡-ésima columna y no 
la ¿-ésima fila como sucedía anteriormente. Todos los razonamien- 
tos, que hemos realizado al demostrar el teorema de Kronecker — 
Capelli, siguen siendo válidos también para el sistema (5), siempre 
que se cambien entre sí en ellos las palabras «columna» «y «fila» y 
siempre que por la matriz ampliada del sistema (5) se comprenda 


la matriz 
Ay +.» Om 
B= - 


Por consiguiente, para que el sistema (5) sea compatible es ne- 
cesario y suficiente m el rango de la matriz B coincida con el 
rango de la matriz Å. Si los rangos de las matrices A y B coin- 
ciden y son iguales al número de incógnitas, el sistema (5) tiene 
solución única. Si los rangos de las matrices A y B coinciden y son 
iguales a un número z menor que el número n de las incógnitas, 
entre las incógnitas podrán encontrarse n—r incógnitas libres 
jo, «++» Emo Y todas las demás incógnitas Es,, ..., El, se expre- 
sarán en términos de éstas por fórmulas de tipo 


AS Ys (=l, aan r) 


Está claro que toda diferencia entre los sistemas (1) y (5) desa- 
parece, si se consideran ecuaciones lineales sobre un cuerpo con- 
mutativo. En el caso de cuerpos no conmutativos K (por ejemplo, 
para los cuaternios (véase el p. 1.5)), además de los sistemas stan- 
dard de tipo (i) y (5) se consideran también ecuaciones de tipo 
«mixto» como es, por ejemplo, la ecuación aE—¿a=0. Sin embargo, 
los problemas relacionados con la resolución de estas ecuaciones 
tienen un carácter específico y se salen de los márgenes del Algebra 
lineal propiamente dicha. 


(5) 
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Complementos y ejercicios 


1. En el espacio de fitas de longitud tres sobre el cuerpo de los números 
racionales se toma un sistema de coordenadas formado por las filas [1, 3, BJ, 
16, 3 2) y la, 1,0); ¿Qué filas de coordenadas tienen en este sistema los vec 
tores 13, 7. Mi, 10.0, 1 [2 3, 5 y [L 1, 1p 

2. Él espacio £ está formado por los polinomios en A de grado no mayor 
gue m Demuéstrese, que los polinomios 1, A=1. 1, <.. A= 1)" consti- 
duyen una base de £. Hállense en esta base las filas de coordenadas de los poo 
linomios 2—3)-+A? y A, 

3. En el plano sé toma un sistema de coordenadas, compuesto por dos vec- 
tores mutuamente perpendiculares de longitud 1, y después se realiza una trans- 


formación de coordenadas de matriz E 5)- ¿Qué condiciones deben verificar 


los números œ, P, y y ð para que los nuevos vectores coordenados sean mutua- 
mente perpendiculares y de longitud 12 
4. Hállense los rangos de las matrices 


10257 LEFT 
21123[[xyzu 
21 7174 f| epu py 
L 131641585 | Lepu) L 


5. Demuéstrese que en el cuerpo de los cuaternios K (p.1.4) el sistema de 
ecuaciones lineales «a la derecha» 
Ritk=l, ) 
El 
tiene solución única, mientras que el sistema de ecuaciones «a la izquierda» 


E+ES=1, 1 

ksimi I 
no tiene soluciones. Tenemos así un ejemplo de una matriz invertible sobre un 
cuerpo, cuya matriz transpuesta no es invertible. 

6, Hasta el momento entendíamos la independencia lineal de filas como la 
independencia lineal respecto a la multiplicación de filas a la izquierda por los 
elementos del cuerpo K y la independencia lineal de las columnas como la inde- 

"dencia respecto a la multiplicación de columnas a la derecha por los elemen- 
los del cuerpo, Esto está relacionado con la regla inicial de multiplicación de 
las motrices: las filas de lo primera se multiplican por las columnas de la se- 
unda, Por supuesto, la teoria no cambiará si las matrices se multiplican por 
ja regia «izquierda»: tas columnas de la primera se multiplican por las filas de 
la segunda. Pero en este caso, habrá que considerar la dependencia lineal de las 
filas respecto a la multiplicación a la derecha por los elementos de K y la 
dependencia lineal de Jas columnas respecto a la multiplicación a, la izquierda 
por los elementos de K. Como resultado, obtendremos los rangos de una matriz 
según Jas filas a la derecha y según las columnas a la izquierdo. Ambos rangos 
coincidirán, pero en el caso general serán diferentes de los rangos corrien 
según las filas (a la izquierda) y según las columnas (a la derecha). Como 
ejemplo puede servir la matriz de cuaternios 


L-i 

k=l 

del ejercicio 5, en la que el rango a la izquierda según las filas es igual, a 2, 
mientras que él rango a la derecha según las filas e igual al. 


7. Sea A una matriz cuadrada invertible de orden n y sean B e matris 
arbitrarias compuestas, respectivamente, por n filas y n columnas. En estas con- 
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diciones, se tiene 
rango (AB) = rango B, 
rango (CA) =rango C. 
8, Dése un ejemplo de matrices cuadradas A y B de un mismo orden 2, 
para [as cuales se tenga rango (AB) x rango (BA) 


'muéstrese que pare cualesquiera matrices cuadradas A y B de orden 
n se tiene 


rango (AB) = rango A + rango B—n. 


§ 6. Subespacios lineales 


1. Intersección y suma de subespacios. Un conjunto no vacio 
Q de vectores de un espacio lineal & se lama subespacio lineal de 
este espacio, si se cumplen las dos condiciones siguientes : 

1° si A contiene un vector a, también contiene todos los múltiplos 
ha, donde à es un número del cuerpo de coeficientes; 

7 si U contiene unos vectores a y b, también contiene su suma 
atb. 
Está claro que ambas condiciones equivalen a la siguiente: sí A 
contiene unos vectores a y b, también contiene cualquier combinación 
lineal da-+ub de los mismos. 

De estas definiciones se desprende que todo subespacio lineal A 
contiene el vector nulo y todas las combinaciones lineales de cuales- 
quiera vectores suyos. 


En el p. 4.3 se ha señalado que todo espacio linen) sobre un cuerpo K es 
un álgebra en la que las operaciones principales son: la adición de vectores, la 
inversión de vectores y la multiplicación de los vectores (a la izquierda) por 
elementos de K, Puesto que la inversión de un vector equivale a su multipli- 
cación por el elemento —1 de K, las condiciones 1° y 2* significan simplemente 
que los subespacios lineales del espacio Y son subálgebras del álgebra Q. 


El conjunto compuesto solamente del vector nulo posee las pro- 
piedades 1° y 2° y, por consiguiente, es un subespacio lineal de Q. 
Este subespacio se llama subespacio nulo. Por otro lado, el propio 
espacio £ puede ser considerado como un subespacio lineal de sí 
mismo. El subespacio nulo y £ suelen llamarse subespacios trivia- 
les del espacio &. Todos los demás subespacios se denominan no 
triviales o propios. 

El método más sencillo de obtener subespacios lineales consiste 
en lo siguiente, En el espacio lineal dado £ se toman unos vecto- 
res arbitrarios a,, aa ..., Aa y se consideran todas las combina- 
ciones lineales de los mismos 


20,+04+..- -A 
Sea A el conjunto de estas combinaciones. Puesto que la suma de 


$ 6, Subespacios lineales 103 


combinaciones lineales de a,, ..., da y el producto de una combi- 
nación linea] por un número son combinaciones lineales de a,, . 
tenemos que A es un subespacio lineal. Los vectores a, . 
son los generadores de este subespacio. Suprimiendo aquell 
dependen linealmente de los anteriores, obtendremos un sistema 
linealmente independiente de generadores del subespacio A, es de- 
cir, una base de A. Pero el número de vectores de una base coin- 
cide con la dimensión del espacio y, por ello, la dimensión del 
subespacio A es igual al número máximo de vectores linealmente inde- 
pendientes que contiene el sistema a, ..., Gn. A veces se dice que 
el subespacio A es el subespacio tendido sobre los vectores ay, . .., am. 
Por consiguiente, la dimensión del subespacio tendido sobre el 
sistema de vectores a}, ..., a, es igual al número máximo de vec- 
tores linealmente independientes que contiene este sistema. 

El método de tender los subespacios sobre un sistema de vecto- 
res dado es general: todo subespacio lineal A de un espacio lineal € 
es el subespacio tendido sobre su base. 

Como que el número de vectores linealmente independientes de 
£ no puede superar la dimensión de L, de aquí se ve que la di- 
mensión de un subespacio lineal no puede superar la dimensión del 
espacio que lo envuelve. Es más, si la dimensión del espacio lineal 
£ es igual a la dimensión del subespacio Y, toda base de A será 
también una base de £, Por esto, todo vector de & se expresará 
linealmente en términos de una base del subespacio A, es decir, 
A coincidirá con £. Por consiguiente, la dimensión de todo subes- 
pacio lineal propio es inferior a la dimensión del espacio que lo 
envuelve, 

A título de ejemplo consideremos el espacio corriente R, formado 
por los segmentos orientados que parten de un punto O. La dimen- 
sión del espacio R es igual a tres y, por esto, los subespacios pro- 
pios pueden ser de dimensión uno o dos. Los subespacios de dimen- 
sión uno deben ser tendidos sobre un vector no nulo a, es decir, 
deben ser el conjunto de los multiplos «a del segmento a. Pero 
todos los segmentos de tipo «a se hallan sobre la recta que con- 
tiene al vector a. Por consiguiente, los subespacios de R de dimen- 
sión una son las rectas que pasan por el punto O. 

Los subespacios de dos dimensiones deben ser tendidos sobre 
dos vectores linealmente independientes, es decir, sobre dos vecto- 
res a y b que no pertenecen a una misma recta. Sea A el plano 
que pasa por los vectores a y b. Entonces, todas las combinaciones 
lineales «a-+Bb pertenecerán al plano A y, por otro lado, todo 
vector perteneciente a A será una combinación lineal de los vec- 
tores a y b. Por consiguiente, el subespacio tendido sobre los vec- 
tores a y b será el conjunto de vectores pertenecientes al plano A. 
Luego, los subespacios de dos dimensiones del espacio R son los planos 
que pasan por el punto O. 
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Los espacios de dimensión mayor que tres no admiten una inter- 
pretación geométrica tan clara. Sin embargo, a ellos también se 
aplica la terminología geométrica llamando rectas a los subespacios 
lineales de una dimensión, planos a los subespacios de dos dimen- 
siones y planos de k dimensiones a los subespacios de dimensión k, 
para £>3. Los subespacios lineales de dimensión menor en 1 que 
la dimensión del espacio llevan el nombre especial de hiperplanos. 

Con los subespacios de un espacio lineal dado se pueden efec- 
tuar determinadas operaciones; las más importantes de éstas son la 
adición y la intersección. Se llama intersección de los subespacios 
A, Y, ... de un espacio Y el conjunto $ de los vectores que per- 
tenecen simultáneamente a todos estos espacios. La operación de 
intersección se indica por el símbolo N, de modo que 


P=ANBN... 


La intersección de cualquier número de subespacios lineales de un 
espacio £ es un subespacio lineal de este espacio. 

En efecto, el vector nulo pertenece a cada uno de los subespa- 
cios dados A, 8, ... Por esto, pertenece también a la intersección 
SB de los mismos que es, por consiguiente, un conjunto no vacio, 
Por otro lado, si unos vectores a y 6 pertenecen a la intersección Y, 
estos vectores, y con ellos cualquier combinación lineal «a+ Bb de 
los mismos, pertenecerán a cada uno de los subespacios A, sa 
Por consiguiente, aa-+ Bb está contenido en B, es decir, PB es un 
subespacio lineal. 

Se llama suma de un número finito de subespacios lineales A,, 


As, ..., Y, del espacio £ el conjunto de vectores que pueden ser 
representados en la forma 
a=0,+4,+... +4, 0) 


donde a; es un vector de M; (¿=1, ..., s}. La operación de adi- 
ción de subespacios se indica por el símbolo +. 

La suma de un número finito de subespacios lineales de un espa- 
cio Y es también un subespacio lineal; contiene todos los vectores de 
los subespacios dados, así como todas sus combinaciones lineales. 

En efecto, sean M, ..., A, los subespacios lineales dados y 
sea A= A, +... +A. Si a y b son unos vectores de A, ello sig- 
nifica que pueden ser representados en la forma 


a=44+0+...+4, y b=b,+b,+...+0,, 


donde a; y b; pertenecen a A, (i=1, 
para cualesquiera a y B de K la expresi 


20+Bb=(00, + Pb) +(00, + Bb) +... + (aa, + Bb.) 


es la descomposición en la forma (1) del vector «a-+ßb, ya que la 
suma aa,- Bb, pertenece a A. Por consiguiente, aa + Bb pertenece 


s). Pero, en este caso, 
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aA y A es un subespacio lineal. Tomando ahora en (1) ay=0 
para ji, vemos que a, estará contenido en A, es decir, A con- 
tiene todos los vectores de Aj. 

Indiquemos, finalmente, sin demostración las propiedades siguien- 
tes de la suma de subespacios, que se desprenden directamente 
de su definición: 

1 A+ B=Y + 

2 U4 (BA 6) = (AD) 4 €; 

3° si A está contenido en un subespacio ®, se tiene A+B=B. 

Considerando la suma de dos subespacios lineales arbitrarios Y. 
y B, podremos ver fácilmente que su dimensión depende no sólo 
de la dimensión de los subespacios A y B, sino también de cuán 
grande es la parte común de los mismos. El valor exacto de la 
dimensión de la suma se determina por el teorema siguiente: 

TEOREMA La dimensión de la suma de dos subespacios lineales de 
un espacio £ es igual a la suma de las dimensiones de estos subes- 
pacios menos la dimensión de su intersección. 

Sean A y V los subespacios dados y sean r, y r, sus dimensio- 
nes respectivas, Sea m la dimensión de la intersección © de estos 
subespacios. Tomemos en € una base cualquiera c, Cp ..., Cp. 
Los vectores Cy, Ca, ..., Gu Son linealmente independientes y per- 
tenecen a A. Por esto, en Y se pueden encontrar unos vectores a,, 
üp» ..., Gp, tales, que el sistema a, G, ..., Ars Cis .-., Cm Sea 
una base de M (véase el p. 4.2). Por esta misma razón, en el su- 
bespacio Y existen vectores b,, bs, ..., 6, tales, que junto a los vec- 
tores Ci, Cay ..., Cn constituyen una base de B. Puesto que el nú- 
mero de vectores de una base coincide con la dimensión del espa- 
cio, entre los números k y p y las dimensiones de los subespacios 
Al y Y existen las relaciones 


n=k+m y r,=p+m 

Si demostramos que el sistema 

Ex Ue star Dira S D 

es una base del espacio A-+ B, el teorema 1 quedará demostrado, 

ya que la dimensión del espacio A+% será igual a 
k+m+p=r, rm. 


Todo vector a de A se expresa linealmente en términos del 
sistema Aj ..., Up Cy .-.> Cm que constituye una base de A y, 
por esto, se expresa también en términos del sistema (2). Análoga- 
mente, todo vector b de B también se expresa linealmente en tér- 
minos de (2). Pero en este caso la suma a-+b, es decir, cualquier 
vector de (4 Y, se expresará linealmente en términos de (2). Resta 
demostrar que el sistema (2) es linealmente independiente. 
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Sea 
amt... PAE Ya BA + B by =0 (3) 
una relación de dependencia lineal entre estos vectores. Pongamos 


b= Bibit --- HB 


El vector b se expresa linealmente en términos de los vectores 6,, 
..», b, contenidos en el espacio B; luego, b pertenece a B. Por 
otro ládo de (3) se desprende que 


E Vnta (4) 


Puesto que Q,, ..., Qp, Cis -.-, Ca están contenidos en M, de aquí 
se deduce que b también pertenece a A. Por consiguiente, b figura 
en la intersección de los espacios A y Y, es decir, la expresión (4) 
del vector b en términos de la base de A no contiene términos con 
Qi +++.» Gp en otras palabras, 


a=0,=...=9%=0 
Tomando estos valores en (3), obtenemos 


MARY t Bib t -o HB) =0. 


Pero el sistema C, ..., Cm bn ..., bp es una base de B y, por 
consiguiente, es linealmente independiente, de modo que 


ne .=m-b=...=P,=0 


Hemos demostrado que el sistema (2) es linealmente independiente. 

Del teorema demostrado se puede deducir una desigualdad que 
ofrece el valor mínimo de la dimensión de la intersección de unos 
subespacios. Consideremos unos subespacios lineales A y B de £ y 
sean r, y r, las dimensiones de estos subespacios, n la dimensión 
de £ y m la dimensión de la intersección ANY. En virtud del teo- 
rema, la dimensión de la suma U-+B es igual a r,+71,—m. Pero 
la dimensión de la suma A+% es no mayor que la dimensión del 
espacio £. Por consiguiente, 7,+r,—m<n, de donde se tiene 
m>r,+r,—n. Es decir, la dimensión de la intersección de dos sub- 
espacios lineales del espacio & no puede ser menor que el exceso de 
la suma de las dimensiones de estos subespacios respecto a la dimen- 
sión del espacio £. 

Por ejemplo, la intersección de dos planos del espacio 
de tres dimensiones contiene siempre una recta, la intersección de 
un subespacio de dos dimensiones con un subespacio de tres dimen- 
siones en un espacio de cuatro dimensiones contiene una recta, la 
intersección de dos subespacios de tres dimensiones de un espacio 
de cuatro dimensiones contiene un plano, etc. 
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6.2. Sumas directas. Según la definición, todo vector a que per- 
tenece a la suma de subespacios lineales 
AA HLH.. HAr 

puede ser representado en la forma 

a=a+a,+... +a, (€, i=l, ..., 5). ay 
Sin embargo, esta representación no será, en general, unívoca. Si 
todo vector a de A admite sólo una representación de tipo (1), es 
decir, si de las igualdades (1) y de 

a=a+ a+... +0, (€, i=l, ..., s) (2) 


se deduce que a,=4;, , a=, la suma se llama suma directa 
y se indica 


AsH.. HA, 


Las sumas directas poseen numerosas propiedades especificas, 
algunas de las cuales serán ahora consideradas. Ante todo observe- 
mos que en lugar de exigir que cualquier vector de la suma posee 
un desarrollo univoco se puede exigir que el desarrollo univoco 
exista sólo. para el vector nulo: si el vector nulo de la suma U=MAU,+- 
+%, +... +A, admite un desarrollo único de tipo (1), es decir, st 


atat... tamo (EA, i=l, ..., 8) 


implica que a,=4,=... =0, la suma es directa, 
Para la demosiración tomemos un vector cualquiera a de la su- 
supongamos que admite dos desarrollos: (1) y (2). Restando 
un desarrollo del otro, obtenemos 


(a,—ai) + (a, — a4) +... +(0,—a;) =0. 


Puesto que aqui (a,—a)€ A, i=1, 2, ..., s, tenemos según la 
hipótesis 

a,—a; =a, —4=... =0,—4,=0, 
es decir, 


a =0j, 4, =0j, ..., O, =i, 


Hemos demostrado la proposición. 

El teorema que sigue está relacionado con el empleo de los pa- 
réntesis en las sumas directas, 

TEOREMA 1. Si las descomposiciones de los subespacios lineales 


A=9,+9,+...+9, (8) 
AA HAt His ] 


(O 
ASA HAt + Aino 
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son directas, la descomposición 
AA AA in + + sm (5) 


también es directa; en otras palabras, si en una suma directa todo 
sumando es sustituido por su descomposición directa, se obtendrá de 
nuevo una descomposición directa. Reciprocamente, si la descomposi- 
ción (5) es directa. las descomposiciones (4) y (3) también son di- 
rectas. 

Demostremos primero la proposición directa. Sea 


E 50. 
Escribamos esta igualdad en la forma 


0,+40,+...+4,=0, (6) 
donde 


a/=0 +04 +...+Gm, (i=l, 2, ..., S). (7) 


Como que a,¿€ A, y la suma (3) es directa, de (6) se deduce que 
4,=4,*=...=4,=0 y la igualdad (7) se transforma en 

antant... +am=0 (i=l, 2, ..., $). (8) 
Pero la descomposición 

U, = An t Ag +-.-- 4-Uum, 

es, por hipótesis, directa y por ello de (8) se deduce que ap = a= 
=... = Aim = 0. Por consiguiente, la suma (5) es directa que es lo que 
se quería demostrar. Repitiendo los razonamientos en el orden con- 
trario, obtendremos la demostración de la afirmación recíproca. 

El teorema 1 permite considerar la suma directa de varios sub- 
espacios como el resultado de sucesivas sumas directas de dos su- 
mandos. Las condiciones que garantizan que la suma de dos subes- 
pacios sea directa pueden ser enunciadas de la siguiente forma 
conveniente. 

TEOREMA 2 Para que la suma de dos subespacios lineales de un 
espacio % sea directa es necesario y suficiente que la intersección de 
estos subespacios sea nula. 

En efecto, si la intersección de dos subespacios A y B contiene 
un vector no nulo a, para el vector o se puede escribir la descom- 
posición 

a+ (—a)=0, 
donde a20, aA y —a€B, y, por consiguiente, la suma A+ Y 
no será directa. Viceversa, si la suma A+4-Y no es directa, para el 
vector nulo deberá existir la descomposición 


a+b=0 (axo, a€ y beB). 
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Puesto que b=—a, el vector b figura también en el subespacio A. 
Por consiguiente, la intersección ANB contiene, en este caso, un 
vector no nulo b, que es lo que se quería demostrar. 

TEOREMA 3. La dimensión de una suma directa de subespacios es 
igual a la suma de las dimensiones de estos subespacios. 

Si tenemos dos sumandos, entonces la dimensión de la suma es 
igual, de acuerdo con el p. 6.1, a la suma de las dimensiones de 
los sumandos menos la dimensión de la intersección. Pero, según 
el teorema 2, la intersección de subespacios en el caso de una suma 
directa es nula y su dimensión es igual a cero. Por esto, la dimen- 
sión de una suma directa de dos subespacios es igual a la suma de 
sus dimensiones. Si se tiene más de dos sumandos, la demostración 
se realiza fácilmente por inducción. 

Del teorema 3 se desprende el siguiente corolario: sí el subespa- 
cio U es la suma directa de los subespacios X, ..., A,, entonces, 
escogiendo en cada subespacio A; una base Gj, Gia» -... Qim, (i== 1, 2, 
+...» S) y uniendo estas bases en un sistema 

Aro Oigo + Qim -er Oy Os + Gimp (9) 


obtendremos una base del subespacio YA. 

Efectivamente, todo vector del subespacio A, se expresa linealmente 
en términos de los vectores (9) y por esto cualquier vector de A 
también se expresará linealmente en términos de los vectores (9). * 
En virtud del teorema 3, el número de vectores del sistema (9) es 
igual a la dimensión del subespacio A. Luego, el sistema (9) es 
una base de A, que es lo que se quería demostrar. 

El teorema 3 admite A inversión: si la dimensión de 
una suma de subespacios lineales es igual a la suma de las dimen- 
siones de los mismos, la suma es directa. 

Sea primero A=A, +A, y sea 

dim. A=dim. A, +dim. A,. 
En virtud del teorema del p. 6.1, de aquí se deduce que la dimen- 
sión de la intersección Y, NA, es igual a cero, es decir, que esta 
intersección es nula. A su vez, de aquí se deduce, de acuerdo con 
el teorema 2, que la suma %,+-%A, es directa. Si el número de 
sumandos es mayor que dos, es suficiente aplicar para la demostra- 
ción la inducción. 

6.3. Sistemas de ecuaciones lineales homogéneas. Con el fin de 
ilustrar Ta teoría de subespacios lineales consideremos el problema 
de resolución de los sistemas de ecuaciones lineales homogéneas, es 
decir, de los sistemas de tipo 


E Es + + HE = 0, ) 


(1) 
Eita tEn > HEn an = 0, 
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donde a,, son elementos de un cuerpo K, mientras que E, ..., E, 
son las incógnitas; los valores de las últimas se buscan en el cuer- 
po K. El sistema (1) puede ser representado en la siguiente forma 
matricial 


x-A=0, (2) 


donde x=[E, ..., E,] es la fila de incógnitas y A=/]=;,¡] es la 
matriz en la que la /-ésima columna está formada por los coefi- 
cientes de la ¡-ésima ecuación del sistema (1). La fila nula [0, ..., 0] 
ofrece una solución del sistema (1) cualesquiera que sean los coefi- 
cientes ay. Esta fila se llama solución nula o trivial del sistema (1). 
La existencia de la solución trivial indica que un sistema de ecua- 
ciones lineales homogéneas nunca es contradictorio. 

Para poder estudiar con más detalle las propiedades de las so- 
luciones del sistema (1) indiquemos por el espacio de filas de 
longitud n sobre el cuerpo K y consideremos toda solución (Ef, ..., 
En] del sistema (1) como un vector x del espacio Y que satisface 
la ecuación (2). El conjunto de todas las soluciones de la ecuación 
(2) es un subespacio lineal del espacio Q. Efectivamente, de (2) y 
de y: 4=0 se deduce que 


Ox-+py) A =A (rA) +p (yA) =0 


cualesquiera que sean À, p €K. En otras palabras, una combinación 
lineal arbitraria de soluciones del sistema Ms también una so- 
lución del sistema (1). Puesto que el espacio Y es de dimensión n, 
el espacio de soluciones del sistema (1) es de dimensión no mayor 
que n. 

Se dice que unas soluciones x,, ..., x, del sistema (2) forman 
un sistema fundamental de soluciones de (2), si cualquier solución 
del sistema (2) puede ser representada en forma de una combinación 
lineal Ax,+...+2,x, de las- soluciones indicadas y, al mismo 
tiempo, ninguna de las soluciones x, +, Xs puede ser representada 
como una combinación lineal de las restantes. En términos de la 
teoría de espacios lineales esto significa que el conjunto x,, ..., Xs 
es simplemente una base del subespacio de soluciones y que el número 
de soluciones fundamentales es la dimensión del subespacio de so- 
luciones. 

El rango de la matriz A se llama rango del sistema homogéneo (1). 
Los sistemas homogéneos de tipo (1) representan un caso particular 
de los sistemas lineales generales estudiados ya en el p. 5.3. Emplean- 
do el teorema de Kronecker—Capelli demostrado en aquella oca- 
sión se obtiene fácilmente el siguiente teorema principal: 

TEOREMA SOBRE LAS ECUACIONES LINEALES HOMOGÉ ¿EAS. La dimen- 
sión del espacio de soluciones del sistema (1) de ecuaciones lineales 
homogéneas con n incógnitas es igual a la diferenc a n—r, donde r 
es el rango del sistema (1). 
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n, el sistema (1) debe tener, según el teorema de Kronecker— 
una solución única que es, por consiguiente, la solución nula. 
El subespacio de soluciones consta solamente del vector nulo y su 
dimensión es igual a O, es decir, coincide con la diferencia n—r. 

Sea r<n. En virtud del teorema de Kronecker—Capelli, el 
sistema (1) será en este caso (después de realizar de nuevo una enu- 
meración adecuada de las incógnitas y de las ecuaciones) equiva- 
lente a un sistema de tipo 


BS brara H >> Enano ) 


(3) 


donde y,, son determinados elementos de K. A las incógnitas 

Bpen «00» E, se les puede asignar aquí cualesquiera valores de K. 
Tomando sucesivamente 

vo Bnr Erse «++» En] =[1, O, 

Era Brne «++» En] = [0, 


(rer Ene <+- Enj=[0, O, ..., 1] 
Y calculando toda vez los valores de las incógnitas E,, ..., E, según 
las fórmulas (3), encontramos el siguiente sistema de soluciones de (1): 


- 0), 
0), 


a= [res wo 
Ca = [Pors wo 
y lares idas (4) 


Caer = [Ynis «<> Yars 


etina k O 50 0) 


Sabemos que el número de filas linealmente independientes en el 
sistema cr, ..., Cp=, Coincide con el rango de la matriz formada por 
estas filas. Pero de (4) se ve que la matriz indicada contiene un 
menor, formado por las últimas n—r columnas, que es la matriz 
unidad. Por esto, el rango de la matriz es igual a n—r y, por 
consiguiente, todos los vectores c,, ..., a-p son linealmente inde- 
pendientes, Por otro lado, las fórmulas (3) muestran que toda solu- 
ción x==[8, ..., E2] satisface la relación 


A 


es decir, es una combinación lineal de las soluciones c, ..., C,-,. 
Hemos verificado de esta forma que el sistema c, ..., n-p es Una 
base del espacio de soluciones del sistema (1) y, por esto, la di- 
mensión de dicho espacio es igual a n—r. 

Indiquemos dos corolarios directos del teorema demostrado, 
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COROLARIO 1. Para que un sistema de n ecuaciones lineales homo- 
géneas de n incógnitas 


Bant- -o Eta 0, } 


Eram H + + o A Enn, 


con coeficientes de un cuerpo cualquiera K no tenga soluciones no nulas, 
es necesario y suficiente que la matriz de esta sistema 


sea invertible. 

Efectivamente, la condición n=r significa que el rango de la 
matriz A debe coincidir con su orden, es decir, la matriz A debe 
ser invertible. 

COROLARIO 2. Para que un sistema de n ecuaciones lineales homo- 
géneas de n incógnitas con coeficientes de un cuerpo conmutativo tenga 
solución no nula es necesario y suficiente que el determinante de la 
matriz de este sistema sea igual a cero. 

En efecto, una matriz cuadrada formada por elementos de un 
cuerpo conmutativo no es invertible si, y sólo si, su determinante 
es igual a cero, 

Hemos visto que el teorema sobre las ecuaciones lineales homo- 
éneas es un corolario directo del teorema de Kronecker— Capelli. 
1 último teorema, además de ser cierto para los sistemas lineales 

con coeficientes a la derecha, tiene lugar también para los sistemas 
lineales con coeficientes a la izquierda. Por esto, junto al teorema 
sobre las ecuaciones lineales homogéneas y al corolario 1, son válidas 
las proposiciones análogas relacionadas con sistemas de ecuaciones 
lineales homogéneas con coeficientes a la izquierda, a saber: el con- 
junto de soluciones columnas x= {$}, ..., Es] de un sistema de ecua- 
ciones lineales homogéneas 


a | 


(5) 


con coeficientes de un cuerpo K es un subespacio lineal del espacio 
formado por todas las columnas de longitud n sobre K. La dimen- 
sión de este espacio de soluciones es igual a n—r, donde 7 es el 
rango de la matriz A =||æ;||, en la que la ¿-ésima fila está formada 
por los coeficientes de la i-ésima ecuación del sistema (5). 
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Ejemplos y problemas 


1. Hállese la dimensión del subespacio lineal tendido sobre ios vectores 
ami 3, 2 i), b=, 9, 5, 4] y e=], 7, 4, 31, 

2, SÍ ea, ez, .... €n es una base de un espacio lineal E y Y es el subespacio 
lineal tendido Sobre ej, "se tiene 


CETE E SEE 


3. Para todo subespacio propio A de un espacio € existe un subespacio 
lineal YB, tal, que L=4-9. 

4. Demuéstrese la siguiente generalización del teorema 2 del p. 6,2: para 
que la suma de varios subespacios lineales dados sea directa es necesario y su- 
ficiente que cada uno de los subespacios dados tenga intersección nula con la 
suma de los restantes. 

5, Demuéstrese que la intersección de todos los subespacios lineales de un 
espacio X, que contienen a los subespacios lineales dados, es igual a la suma de 
los últimos. 

6. Demuéstrese que para cualesquiera subespacios A, W y G de un espacio 
lineal tienen lugar los igualdades 


1 AB+C=UY+AG, 
(U+B) A+ 6)=U4(U + B) 6, 


donde. para abreviar, la intersección de subespacios se Indica igual que el 
'oducto. 
ado espacio lineal £ de dimensión infinita contiene un subespacio lineal 
propio cuya dimensión coincide con la dimensión de todo el espacio @. 

8 ¿hara qué valores de % (del cuerpo de los números complejos) el sistema 
de ecuaciones 


xy —= ht y, 
2x4 y— màr, ) 
x+ y 2=0 

tiene solución no nula? ¿Para qué valores de A el espacio de soluciones de este 

sistema es de mayor dimensión? 

9. ¿Para qué valores del parámetro A el sistema de ecuaciones 
x+ y+d2) 21, 
AE dal 

es compatible? 

10. ¿Qué dimensión tienen los espacios de soluciones de los sistemas 


ro ly+ iz=0 x =y 4zi =0 
ix+ky— 2=0 y xi+yiz =0 ) 
x—iy+21—pr2=0 Í x —yl +z(Q1—/)=0 


considerados sobre el cuerpo de los cuaternios (p.1.5)? 

11. ¿Existe un polinomio en variables cuaternias a,b, ¢ y d y con coeficien- 
tes cuaternios, tal, que su anulación sea la condición necesaria y suficiente 
para que el sistema” de ecuaciones lineales 

ax+by=0 y cr+dy=0 
tenga solución no nula? PAS 

12. ¿Existe un polinomio en a, d, b, D, c, €, d y F que satisfaga las exigen- 
cias del ejercicio anterior? 
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Capítulo 1H Aplicaciones lineales 


El objetivo principal de este capítulo es el estudio de las pro- 
piedades de las aplicaciones de espacios lineales. En los parágrafos 
8 y 10, así como en los puntos 9.1, 11.1 y 11.2, el cuerpo principal 
no se somete a ninguna restricción. En los puntos 9.2, 9.3, 11.3 y 11,4 
y también en el $ 12 se supone que el cuerpo principal es un cuerpo 
conmutativo. En el $ 7, de carácter de introducción, se establece 
una serie de conceptos y de propiedades relacionados con aplicaciones 
de conjuntos absolutamente arbitrarios. 
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7.1. Producto de aplic: es. Consideremos un conjunto Jt de 
entes arbitrarios. Este conjunto puede estar compuesto tanto por 
un número finito como infinito de elementos. Se llama aplicación 
del conjunto Mi toda ley que permite a partir de 
cualquier elemento del conjunto M encontrar de 
nuevo un elemento de M. Convendremos en in- 
dicar las aplicaciones por las letras 4, B, ... 
Si m es un elemento de M, indicaremos por 
mA aquel elemento del conjunto M que se 
obtiene del elemento m mediante la aplicación 4. 
El elemento m.4 se denomina imagen del ele- 
mento m en la aplicación 4, mientras que m se 
denomina imagen recíproca del elemento ma, 

Consideremos, a título de ejemplo, el, con: 
junto de todos los puntos del plano y sea Y 
la aplicación que consiste en el giro de los puntos de este plano 
alrededor de uno de sus puntos O en 90° en contra del movimiento 
de las agujas del reloj (fig. 2). 

Recurriendo a la figura, vemos que 

aU=b y CU=d, 


Fig. 2. 
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Análogamente, si D significa el traslado de los puntos en una unidad 
paralelamente al eje Oa, se tiene. 


aD=c y bD=f. 


Dos aplicaciones 4 y B del conjunto M se llaman iguales, si 
para todo elemento m de D se tiene. 


md = mB. 


Uno de los conceptos principales de la teoria de aplicaciones 
es el de producto de aplicaciones que se introduce del lo siguien- 
te. Sean Æ y B dos aplicaciones del conjunto WM. La primera 
transforma un elemento arbitrario m del conjunto M en mt. Si este 
nuevo elemento se somete a la aplicación B, se obtendrá el elemento 
(mA)B. La aplicación que transforma el elemento m directamente 
en (m4) B se llama producto de Æ por 2 y se designa AB. Es decir, 
se toma por definición que 


MAR) =(mA) B. 


Si al elemento m se aplica primero la aplicación B y después la 
aplicación 4, se obtendrá el elemento (m3) 4 que puede no coin- 
cidir con (mat) B. Efectivamente, en el ejemplo con el plano, con- 
siderado anteriormente, se tiene 


a(UD)=(AU) D=bD=f, 

a (DU) = (aD) U =U =d 
y, por consiguiente, UD + DU. Por lo tanto, el producto de apli- 
caciones depende, en general, del orden de los factores. Vemos, pues, 
que una de las leyes principales que se verifica para el producto 
de los números no se cumple para las aplicaciones. Sin embargo, 
la otra ley principal —la asociatividad de la multiplicación —se con- 
serva para las aplicaciones. En efecto, sean 4, B y 8 aplicaciones 
arbitrarias del conjunto M y sea m uno de sus elementos. Por de- 
finición, tenemos 


m(AB)6)=(m (43) € =(m 4) B) €, 
m(A (BE)) = (mA) (BE) = (M4) B) 6, 


(43) € = A (38). 

Empleando esta ley es fácil deducir que el producto de cualquier 

número finito de aplicaciones, tomadas en un orden determinado, no 
depende de la disposición de los paréntesis. Asi, por ejemplo, 
(AB) (ED) =((4B) €) D=(4(3€)) D = A (BE) D). 

Por esto, en los productos que contienen varios factores se pueden 


omitir los paréntesis y se puede hablar simplemente del producto 
de dos, de tres y de un número mayor de aplicaciones. El producto 


de donde 


s 
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de n factores iguales a 4 se llama n-ésima potencia de la aplicación 4 
y se indica por .4”. Las operaciones con las potencias se realizan 
siguiendo las reglas corrientes 


An ro, w 
ayaa (2 


la demostración de las mismas es evidente. 

Si el producto de dos aplicaciones w¿ y 3 no depende del orden 
de los factores, se dice que £ y B son permutables o que conmutan. 
La fórmula (1) señala que las potencias de una misma aplicación 
son permutables. 

Si las aplicaciones 4 y B conmutan, se tiene 


(ABY = ABAB = AABB = HP 


y, en general, 

(ABY =4"P". (3 
Er cambio, si 4 y B no conmutan, la fórmula (3) puede no tener 
lugar. 

7.2. Las aplicaciones idéntica e inversa. Entre todas las aplica- 
ciones de un conjunto M desempeña un papel especial la aplicación 
que pone en correspondencia a todo elemento m de este conjunto 
el propio elemento m. Esta aplicación leva el nombre de aplicación 


unidad o idéntica y será indicada en adelante por $. Es decir, para 
todo m se tiene 


me =m. 


Sea 4 una aplicación arbitraria del conjunto Wt. Puesto que 


m(SA) =m) A =maA 
y 
m(46) =(m4) =m, 
se tiene 
$A=4E =A. 
Si dada la aplicación .4 se puede hallar una aplicación 3 tal que 
ABBA =6, 103) 


se dice que 3 es la inversa de A, mientras que 4 se denomina 
invertible, Es fácil ver que toda aplicación invertible tiene sólo una 
inversa. Efectivamente, si «4 posee dos aplicaciones inversas 3 y €, 
entonces, multiplicando la relación 


A6=8 
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a la izquierda por 3 y empieando las igualdades (4) y la asocia- 
tividad de la multiplicación de las aplicaciones, obtenemos 
EE =B6, es decir, 8 =B. 

La aplicación inversa de Z se indica por 4”!. Las relaciones (4) 
son simétricas respecto a £ y B; por esto, sí B es la inversa de 4 
resulta que Z es la inversa de 3, es decir, 

(AAA. (5) 
Tomemos por definición 


V= y ASAF (n=1,2,3, ...). 


De (4) y (5) se deduce fácilmente que las fórmulas (1) y (2) son 
válidas no sólo para exponentes enteros positivos, sino para todos 
los exponentes enteros. En particular, 
(4 =(d YN ==". 
Además, la relación 
AB-B'A' =E 


AB =B. 

7.3. Aplicaciones biyectivas. No toda aplicación es invertible. 
El teorema que sigue ofrece un criterio simple de aplicaciones in- 
vertibles. 

TEOREMA Para que una aplicación A de un conjunto Mi sea 
invertible es necesario y suficiente que A sea una aplicación biyectiva 
del conjunto WM sobre si mismo, es decir, que para todo elemento 
de Wi exista en M su imagen reciproca y que distintos elementos 
de Wi se transformen por la aplicación A en distintos elementos. 

Demostremos primero la necesidad. Supongamos que «£ posee la 
aplicación inversa B, de manera que 


AR=BA=8. 


Tomemos en M un elemento cualquiera m y sea mB=n. Multipli- 
cando esta relación por .4 y sustituyendo Bl por $, obtendremos 
m=nd, es decir, todo elemento m de M es la imagen de un ele- 
mento n de M. Por otro lado, si dos elementos m, y m, son trans- 
formados por la aplicación 4 en un mismo elemento 


MA=Myd, 


entonces, multiplicando esta relación por 3, obtenemos m,=m,. 
Por consiguiente, todo elemento de M tiene en M sólo una imagen 
reciproca. 

Demostremos ahora la suficiencia de las condiciones. Según éstas, 
para todo elemento m del conjunto Di existe un elemento, y sólo 
uno, n tal que 


implica que 


ná=m (6) 
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Indiquemos por B la aplicación que transforma m en n. Es decir, 


mB=n. m 
Multiplicando (7) por 4 y empleando la igualdad (6), obtenemos 
m(BA)=n4=m. 


Puesto que m es un elemento arbitrario, de aquí se tiene Ba =$. 
Análogamente, multiplicando (6) por B y empleando (7), obtenemos 
vB =6. Por consiguiente, 3 es la aplicación inversa deseada. 

7.4, Sustituciones. Las aplicaciones de conjuntos finitos se re- 
presentan, generalmente, mediante tablas, colocando en la primera 
fila de las mismas los símbolos de los elementos del conjunto dado 
en cierto orden y debajo de ellos los símbolos de los elementos que 
les corresponden. Por ejemplo, 


es aquella aplicación dele conjunto de los números 1, 2, y 3 en 
la que el 1 se transforma en el 3, el 2 enel 1 yel3 enel 20, 
empleando la notación aceptada anteriormente, 


lo=3, 20=1 y 30=2. 


Las aplicaciones invertibles de conjuntos finitos se llaman 
sustituciones, Para que una aplicación representada en forma de 
una tabla sea una sustitución es necesario y suficiente que tanto 
en la fila superior como en la inferior aparezcan los símbolos de 
todos los elementos del conjunto, con la particularidad de que todo 
elemento figure sólo una vez. Para representar la sustitución 
inversa o~t basta, evidentemente, convertir la fila inferior de la tabla 
de o en la superior y la superior en la inferior. 


Sea F(x, ..., Xa) una función de las variables x, ..., Xp 
7 sea g una sustitución de Jos números 1, ..., n. El resultado de 
a sustitución ø aplicada a las variables x, ..., x, de la función F 


es, por definición, la expresión 
Fo=F (t -<-s Xan): 
De esta definición se deduce directamente que para cualesquiera 
sustituciones p y o y para cualesquiera funciones F y G de 
Xp ++.» X, se tiene 
F (po) = (Fp) a, (8) 
(FG)0=Fo-Go y (F+G)0=Fo +60. (9) 
Tomemos ahora para la función F la expresión 
A= JY ixa =(%,—x4) (01%). 0 (1 — Xp) (090) ++ + 
izi 
j ad 


(10) 
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Está claro que para cualquier sustitución o se tiene Aa = + A. 
Si Ao=A, se dice que ø es una sustitución par y, si Ao =—A, 
se dice que o es impar. Para toda aplicación no invertible o, tene: 
mos Ag =0. Por esto, para cualquier aplicación ø del conjunto de 
los números l, ..., n tenemos 


A0=e,A, 


donde e,==-+1, si ø es una sustitución par, l, si ø es una 
sustitución impar, y e,=0, si a es una aplicación no invertible, 
El valor del símbolo e, se denomina también signatura de la apli- 
cación o. 

Para dos aplicaciones arbitrarias p y o tenemos de las fórmu- 
las (8) y (9) 


de donde 


= A (po) =(Ap)o=e,e,A, 

ON 
es decir, la signatura del producto de aplicaciones es igual al pro- 
ducto de las signaturas de los factores. Puesto que la signatura de 
la aplicación idéntica es, evidentemente, igual a +1, resulta que 
la signatura de la sustitución inversa siempre coincide con la signa- 
tura de la sustitución dada. 

Se llama sustitución cíclica, o ciclo, (iis. in) la sustitución o 
en la que ¿0O=¿, kosis ..., ime im ino==í, e io=¡ para 
los demás elementos í del conjunto, si es que existen. En particu- 
lar, se llama ciclo doble, o trasposición, (ij) la sustitución que 
cambie los elementos į y / y no altere los demás elementos. Cam- 
biando los índices 1 y 2 en la expresión (10) para A, veremos 
fácilmente que A(1 2) =—A, es decir, que el ciclo doble (1 2) es 
una sustitución impar. Por otro lado, mediante cálculo directo se 
comprueba que 


(0100291 5=(2 y 2 Hi Y2 A= 1) 


y puesto que, además, para cualesquiera p y o siempre Eep = En 
obtenemos 


Eup = bapua ap = Ea y = Ea m 


es decir, todo ciclo doble es una sustitución impar. 

De aquí se deduce, además, que el producto de un número 
impar de ciclos dobles es una sustitución impar y que el producto 
de un número par de ciclos dobles es una sustitución par. En par- 
ticular, de la fórmula 


(123...m=(19(13)...(1m, 
que se comprueba fácilmente, se deduce que un ciclo (i, £,... im) de 
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longitud par m es una sustitución impar y que un ciclo de longitud 
impar es una sustitución par. 

Es claro que los ciclos sin elementos comunes representan susti- 
tuciones que conmutan. Al mismo tiempo, cualquier sustitución 
puede ser descompuesta fácilmente en un producto de ciclos sin 
elementos comunes. Para ello se toma un elemento cualquiera i, 
del conjunto y se mira en que elemento į, lo transforma la susti- 
tución. Si resulta que í, =i, obtenemos para el primer factor el 
ciclo unidad (i), es decir, la sustitución idéntica. Si resulta que 
i,%1,, tomamos la imágen i, del elemento i. Para i,=i obtene- 
mos el factor en forma del ciclo (i, i); si i, =i, pasamos a conside- 
rar la imagen i, del elemento j. Si resulta que i =i, el ciclo se 
cierra y se obtiene el factor (i ii). etc.; considerando uno tras 
otro todos los elementos del conjunto, obtenemos la descomposición 
de la sustitución en ciclos sin elementos comunes. Por ejemplo, 
tenemos 


12345_ 
e-(33237 =(1 3 52 4). 


Multiplicando las signaturas de los ciclos obtenemos que e,=—1. 

Existe también otra forma para determinar la signatura de una 
sustitución: mediante el cálculo del número de las así llamadas 
inversiones. Al representar las sustituciones en forma de tablas 
hemos convenido en que los elementos del conjunto que figuran en 
la fila superior pueden ser dispuestos en un orden arbitrario. Sin 
embargo, en el caso en que el conjunto considerado es la colección 
de los números enteros, podemos convenir en escribir los números 
de la primera fila en el orden de crecimiento. En este caso la 
sustitución quedará plenamente determinada al indicar solamente 
la fila inferior de la tabla, es decir, al indicar una permutación 
de números. La correspondencia entre las sustituciones y las permu- 
taciones, obtenida de esta forma, resulta biyectiva y obtenemos la 
posibilidad de representar las sustituciones en forma de tablas de 
una fila en lugar de tablas de dos filas. Sea o una sustitución que 
corresponde a la permutación i, i, ..., in de los números 1, 2, ..., n. 
Consideremos todos los pares ia, i; iremos que el par ip iy 
forma una inversión, si i>i. De la relación 


d0= [] (n=) = 1] 0, —%) 


se ve que e,=1, si es par el número de factores x,,—x;, para los 
cuales i>i, y que e,=—l, si el número de estos factores es 
impar. Por consiguiente, la paridad de la sustitución o coincide 
con la paridad del número de inversiones en la permutación 
desd 
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Ejemplos y problemas 


1. Tomemos en el espacio corriente un sistema rectangular de coordenadas 
OXYZ. Sea Á el giro del espacio alrededor del eje OX en 90° en dirección de 
OY hacia OZ, sea % el giro en 90” alrededor del eje OY en dirección de OZ 
hacia OX y sea @ el giro en 90° alrededor del efe 0% en dirección de OX 
hacia OY. Sea m el punto de coordenadas (1, 0, 1). Caledlonse las eur 
de los puntos m4, m(BE) y m(8B). Demuéstrese z? 
que 

A BASES E, ABE BA y ABBA. 1 

2. Consideremos dos aplicaciones A y @ deun 1 

conjunto arbitrario M aceptando que $ es invertible g! 
Tomemos un elemento cualquiera u de M y sea “4 le 
u=ud. La aplicación Y£ «traslada» los elementos u y A f 
ven unos elementos xe y. Demuéstrese que en estas — Y A 
condisiones la aplicación 8-146 translorma xen y y $ 
ig. 3). 
© S Soa O un punto arbitrario del plano, sea «£ el 
iro del plano alrededor del punto 9 en un ángulo 
terminado æ y sea B el traslado paralelo del plano 
a una distancia a en una dirección determinada, Demuéstrese que B="4% es 
el giro en el ángulo œ alrededor del punto OB y que A“1BA es el traslado del 
plano a la distancia a en la dirección que se obtiene girando en el ángulo œ 
la dirección Inicial. 


Le 


Fig. 3. 
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8.1. Propiedades elemen! Se llama aplicación de un espacio 
lineal ¥ una ley que a todo vector de Y pone en correspondencia 
de nuevo un vector determinado de £. Una. aplicación se llama 
lineal, si transforma el producto de un número por un vector en 
el producto del mismo número por el vector correspondiente y la 
suma de vectores en la suma de los vectores correspondientes. 
Abreviando, una aplicación .4 se llama lineal, si para cualesquiera 
vectores x e y del espacio £ y para cualquier número a del cuerpo 
de coeficientes tienen lugar las igualdades 


(ax) A =a (xA), (1) 

wt A =xd + yA. (2) 
Tomando a2=0 en (1), obtenemos 
oA =0, 


es decir, toda aplicación lineal transforma el vector nulo en el vec- 
tor nulo, 

De (1) y (2) también se desprende directamente la siguiente 
propiedad principal de las aplicaciones lineales: si .4 es una apli- 
cación lineal, se tiene 


(at atado H Anka) 1 = 2 (o) Ha (ol) + o El), (3) 
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donde Xy, Xy -.:, Xm Son vectores arbitrarios de L y QU, Wa -=+ Om 
son números arbitrarios del cuerpo de coeficientes. 

Para la demostración basta aplicar la inducción según m. Para 
m=1 la fórmula (3) coincide con (1). Supongamos ahora que (3) 
es válida en el caso de m—1 sumandos. Entonces 


(0%, 40% + H Ann) A (02%, H Aa H + En) A E 
= (0,X,) A + (Aotr + -H Aann) A= 
=a, (A) H (AH > > > H Un nt) 


que es lo que se quería demostrar. Para m=2, la fórmula (3) se 


convierte en 
(ax + By) A= a (x4) +B 4), (4) 


de donde para $=0 y a=f=1 se obtiene de nuevo (1) y (2). 
Por consiguiente, la propiedad (4) caracteriza totalmente las apli- 
caciones lineales y puede servir de definición de las mismas. 

Hemos convenido anteriormente en llamar aplicación idéntica $ 
aquella apicacon que transforma todo elemento en sí mismo. Por 
esto, si el conjunto considerado es la colección de los vectores de 
un espacio lineal £, se tiene 


(ax+ By) E = ax + By =a (x8) +B (46). 


Por consiguiente, la aplicación idéntica de un espacio vectorial 
es lineal. La aplicación que transforma todo vector en el vector 
nulo se llama nula y se indica por O. Está claro que la aplicación 
nula también es lineal. 

Consideremos dos ejemplos concretos. Sea M el espacio vectorial 
corriente, es decir, el conjunto de segmentos orientados que parten 
de un punto fijo O. Consideremos un pe que pasa por O e indi- 
quemos mediante x.4 la proyección del segmento x sobre este plano. 
Entonces las conocidas propiedades de las proyecciones — 1) la proyec- 
ción de una suma de segmentos es igual a la suma de sus proyec- 
ciones y 2) si un segmento es aumentado en a. veces, su proyección 
también se aumenta en a veces— pueden ser representadas en forma 
de las igualdades 

(+y) A=x4+yA y (ax) A=a(x4), 
de las cuales se desprende que la operación de proyección es una 
aplicación lineal. E 

Como segundo ejemplo consideremos el conjunto de todos los 
polinomios en la variable A de orden no mayor que n. Estos poli- 
nomios forman, respecto a las operaciones corrientes de adición y de 
multiplicación por número, un espacio lineal de dimensión n+ 1. 
Pongamos en correspondencia a todo polinomio su derivada. Puesto 
que la derivada de una suma es igual a la suma de las derivadas 
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de los sumandos y puesto que un factor constante puede ser extraído 
del signo de la derivada, resulta que la operación de diferenciación 
es una aplicación lineal del espacio de polinomios. 

Veamos ahora mediante qué elementos puede ser definida una 
aplicación lineal. 

TEOREMA Sea a, G, ..., a, una base de un espacio lineal L. 
Tomemos en % unos vectores absolutamente arbitrarios b,, by, 
Entonces existe una aplicación lineal del espacio €, y sólo 
transforma los vectores dy, Az, ..., a, en los vectores by, by, ..., bn 
respectivamente. 

Para construir la aplicación deseada, tomemos un vector arbi- 
trario x y representémoslo linealmente en términos de la base 
dr, as ..., Ap. Sea 


x= ha, Hm +... H Enan- (5) 
Consideremos el vector 
x= kibi Hib + o H Enba 


Indiquemos por 4 la aplicación que transiorma x en x'. Por con- 
siguiente, si x está representado por (5), se tiene 


xA = kbi Hibs H > + Babn (6) 


Tomando aquí E=1 y E,/=0 (ii, j=1, 2, ..., n), obtenemos 
a, d=b, (i=1, 2, ..., n), de modo que la aplicación ⁄ transforma 
los vectores Aj, ..., 4, en b, ..., On, Demostremos que 4 es 
lineal. Multiplicando (8) por un número cualquiera œ, tendremos 


ax = (a) a, + (051) 0,+... + (08n) ay: 
Comparando este resultado con (6), obtenemos 
(ax) A = (a,) b, + (a81) ba - - + (En) bn 


(ax) A == a (x4). (7) 


es decir, 
Sea 
Y= Hn + -H Nan 
otro vector de £. Entonces se tiene 
x+y= it) t Hda o H En + 01) 0, 
y, por consiguiente, 
YA = Nb, + Med Mao 
EHu) A= (Est m1) ++ >> EnH Ma) 
De la última igualdad resulta 
aty A=kb t.. Eba Hb H += XA Hol. (8) 
Las propiedades (7) y (8) significan que € es lineal. 
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Resta probar que toda aplicación lineal 2 que transforma 


Aj ...1 An en by ..., b, coincide con 4. Por hipótesis, 0/8 =b; 
(i mi 2, ..., n). Luego, si el vector x está representado por (5), 
se tiene 


xB=E(0,B)+...+Enla,B)=Eb + - -+H Enb = XA, 
es decir, B=.4. Hemos demostrado el teorema. 


8.2. Matriz de una aplicación lineal. Veremos ahora cómo se 
puede definir una aplicación lineal mediante números. Tomemos en 
el espacio un sistema cualquiera de coordenadas a,, a, a 0% 
y supongamos dada una aplicación lineal «4 de este espacio. La 


aplicación Æ transforma los vectores a, ..., a, en unos vectores 
Aj, AA, ..., AA que pueden ser expresados linealmente en tér- 
minos de a, Aj, --., Gp. Sean 


A + -> F Ainan 


y Dis 


formada por las filas coordenadas de los vectores at, ..., apl, 
se llama matriz de la aplicación 4 en el sistema de coordenadas 
Ur Ay >., Gp» Por consiguiente, dado un sistema de coordenadas, 
a toda aplicación lineal corresponde una matriz determinada. Surge 
la pregunta de si esta correspondencia es biyectiva. La respuesta 
es positiva ya que conociendo la matriz A podemos encontrar pri- 
mero los vectores 


bi = an0, + 050) + o- + Ops 
by = an0, + Al, H «e H Oinam 


y después construir, de acuerdo con el teorema del punto anterior, 
la aplicación lineal 4 que transforma a, ... , a, en b... , bn 
respectivamente. Esta aplicación es única y su matriz coincide, 
obviamente, con la matriz A que es lo que se quería demostrar. 

Veamos qué matrices corresponden a las aplicaciones idéntica 
y nula del espacio £. Sea a,, a, ..., a, un sistema arbitrario de 
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coordenadas de £. Entonces tendremos 
0/0=0:4,+...+0:4,, a$=1-4,+... +0:4,, 


Por consiguiente, la aplicación nula tiene la matriz nula y la apli- 
cación idéntica tiene la matriz unidad. 

Planteémonos el problema: ¿cómo conociendo la matriz de una 
aplicación lineal .4 y las coordenadas de un vector x determinar 
las coordenadas del vector x4? 

Se » ...» 2, el sistema de coordenadas escogido y sean 
En En - n las coordenadas del vector x en el mismo. Indique- 
mos por ay (f, ¿=1, ... , n) los elementos de la matriz A de la 
aplicación æ calculados en este mismo sistema de coordenadas. 
Tenemos 


x= hm +E0,+.-. H Enan 
xA =E, (0,4) + Ea (aA) + -H En (an). 
Según la definición de la matriz de una aplicación se tiene 
aA m H gH Onan (i=l, anp n). 
Introduciendo estos valores en la igualdad anterior, obtenemos 


xA = (E H Ea H > o H Enam) ++ 
e H Erant Ean t + + + En) A yo 


Por consiguiente, la fila de coordenadas del nuevo vector x4 es 


[xd] = Bant coo H Ego ++ + Eint + Eso) = [1] A, 


es decir, la fila de coordenadas del vector nuevo es igual a la fila 
de coordenadas del vector antiguo multiplicada por la matriz de ta 
aplicación lineal: 


[x4]= [x] A. 


8.3, Transformación de coordenadas. En el punto anterior ha 
sido establecida una correspondencia biyectiva entre las aplicaciones 
lineales de un espacio vectorial Y de n dimensiones y las matrices 
cuadradas de orden n. Sin embargo, para ello ha sido necesario 
escoger primero en Y un determinado sistema de coordenadas. Si 
cambiamos éste, cambiamos la correspondencia. Tendremos como 
resultado que a una misma aplicación lineal .4 corresponderán en 
los sistemas antiguo y nuevo de coordenadas diferentes matrices A 
y A, Hallemos la relación entre las mismas. 

Sean a, ap... An Y Gi Gu... Ga el antiguo y el nuevo 
sistemas de coordenadas sea T la matriz del cambio (véase el 
p. 5.1). Indiquemos por [x] y [xz], las filas de coordenadas del 
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vector x en el antiguo y en el nuevo sistemas de coordenadas, De 
acuerdo con la regla de una aplicación lineal, tenemos en el sistema 
antíguo de coordenadas 


[x4] =[x] A. 
En el nuevo sistema de coordenadas esta misma regla da 
teth =[x), 4. 


Sin embargo, la regla de transformación de coordenadas del p. 5.1 
muestra que 


LJ =[9,7 y [x4]=[x4],7. 


Introduciendo aquí los valores de [x40), [x4], y [x] de las igual- 
dades anteriores, obtenemos 


(],7A=[x), 4,7. 


Puesto que el vector x es arbitrari » tenemos, aplicando el lema 
del p. 5.1, TA=4,T, 0 
A,=TAT=. 


Es decir, la matriz de una aplicación lineal en el sistema nuevo de 
coordenadas es igual a la matriz de esta misma aplicación lineal en 
el sistema antiguo transformada por la matriz del cambio recíproco. 

Para concluir consideremos el problema de cómo puede ser 
interpretada, desde el punto de vista de la teoría de aplicaciones 
lineales, la matriz del cambio de un sistema de coordenadas por 
otro. Sean a, +» An Y Qi, Aj, ..., a, dos sistemas de coorde- 
nadas dados d espacio £. Según el teorema del p. 8.1, existe 
una aplicación lineal ña determinada unívocamente, que transforma 
el sistema antiguo de vectores coordenados en el sistema nuevo, es 
decir, que posee la propiedad 


E aS=d (i=l, 2, 


Para escribir ahora, según la regla del p. 8.2, la matriz de la apli- 
cación 4J en el sistema antiguo, tenemos que expresar todos los 
vectores a, en términos de a, ..., a„, Pero lo mismo tenemos que 
hacer para obtener la maíriz del cambio. Por consiguiente, la ma- 
triz del cambio es la matriz de la aplicación lineal que transforma 
el sistema antiguo de coordenadas en el sistema nuevo, calculada en 
el sistema antiguo de coordenadas. Es más, la última indicación 
es innecesaria, ya que al calcular la matriz de la aplicación 7 en 
el sistema nuevo de coordenadas obtendremos la misma matriz del 
cambio T. En efecto, si la matriz de la aplicación 7 en el sistema 
antiguo de coordenadas es T, la matriz del cambio tambiéx será T. 
Por lo tanto, la matriz de s en el nuevo sistema será igual a 
TTT=2=T, que es lo que se quería demostrar. 


n). 
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Ejemplos y problemas 
1. Consideremos el espacio de los vectores que pertenecen a un plano y 
pia de un punto O. Demuéstrese que la ablicación, consistente en el giro de 
lodos los vectores en un ángulo a alrededor del punto O, es lineal y que su 
cosa sena 


matriz es igual a > Siempre que el sistema de coordenadas 
—sna cosa 


esté formado por dos vectores perpendiculares de longitud 1. 

2. Sea R el espacio corriente de los segmentos orientados que parten de un 
punto O. Tomemos en R un sistema de coordenadas formado por ts vectores 
perpendiculares ey, ez y es de longitud 1. Demuéstrese que la matriz de la 
aplicación lineal $, consistente en la proyección de los vectores sobre el eje e1, es 


10.0 
igual a b Q Q|» mientras que la matriz de la proyección sobre el plano 


1.0.0 
esta es igual a fO 1 O|. 

3. ¿Cómo cambia la matriz de una aplicación lineal Æ, si en el sistema de 
coordenadas er, es -..» €n se cambian entre si dos vectores cualesquiera, por 
ejemplo, e y 6? 

. Toda” aplicación lineal de un espacio de dimensión uno consiste en la 
multiplicación de todos sus vectores por un mismo número. 

. Sea Q el espacio de todas las matrices cuadradas de segundo orden. 
Demuéstrese que la aplicación „4, consistente en la multiplicación A la dereci 
de todas las matrices de € por la matriz [Y i | es lineal. Háltese lo ma- 


triz de la aplicación E si como sistema de coordenadas de € se toma el sistema 
1.07 fo ı o 0 0 0 
[o o). [b ol E o] y [s 1 


6. Una aplicación lineal Æ de un espacio @ de cuatro dimensiones tiene en 
el sistema de coordenadas er, €s, es y e, la matriz 


1208 E 
103 1 
215 =i 
TER g 


¿Cuál será la matriz de esta aplicación, si para el nuevo sistema de coordena- 
las se toma el sistema 1) er, ea, eg Y esi 2) es, 61 Hes, 01 he hey e Hert este 


§ 9. Operaciones con aplicaciones lineales 


9.1. Multiplicación de aplicaciones lineales. Sean 4 y 3 dos 
aplicaciones Tineales definidas en un espacio lineal &. Aplicando a 
cualquier vector x de £ primero la aplicación .£ y después la apli- 
cación B, obtendremos un vector 

y=(x4) B. 
La aplicación que transforma x directamente en y ha sido llamada 
en el p. 7.2 producto de 4 por B. Por consiguiente, 


x(1B)=(x4) B. a) 
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Demostremos que el producto de dos aplicaciones lineales es una 
aplicación lineal. Para ello es suficiente demostrar, según el p. 8.1, 
que tiene lugar la igualdad 


(ax + By) (AB) =a: x (AB) + P-y (18). 
En virtud de (1) se tiene 
. (ax + By) (AB) =((0x + By) 4) B. 
Puesto que £ y B son lineales, resulta 
lart By) A) B= (a (xd) +p YA) B= ABB YAB, 
es decir. 
(ax + Py) (AB) =0-x(4B)+B-y (48) 
que es lo que se quería demostrar. 
Tomemos en el espacio £ un sistema de coordenadas e indique- 
mos por A y B las matrices de las aplicaciones 4 y B. ¿Cómo 
hallar la matriz de la aplicación 4%? Indiquemos esta matriz 


incógnita por C. Sea x un vector cualquiera del espacio £ y sea [x] 
su fila de coordenadas. Según la regla de aplicación lineal, se tiene 


[x(43)] = [x) C. 
Por otro lado, tenemos 
[x(4B)] = [(44) B] = [x4] B = [x] AB. 
Comparando ambos resultados vemos que 
[x] C = [x] AB 


cualquiera que sea x. De acuerdo con el lema del p. 5.1 de aquí 
se deduce que AR 


es decir, la matriz de un producto de aplicaciones lineales es igual 
al producto de las matrices de estas aplicaciones. 

“Consideremos una aplicación lineal biyectiva 4. Si 4 transforma 
el vector x en y, la aplicación que transforma y en x será la apli- 
cación inversa 47! (véase el p. 7.3) Demostremos que siendo vt 
lineal, también .47* es lineal. En efecto, sea 


UdTi=x y v4 =y, 


donde u y v son vectores arbitrarios de £. Puesto que la aplicación 
A es lineal, se tiene 


(ax + By) A =0-x4 +B-yA =0u + Po, 
de donde resulta 
(au +Bo) 47 =0x+By=a- ud + Budo 
que es lo que se quería demostrar. 
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Siendo A la matriz de la aplicación 4 y X la matriz de la 
aplicación 471, de las relaciones 


AA SA A= 
se deduce que 


AX=XA=E, 


es decir, X=A”*. Por consiguiente, la aplicación inversa tiene la 
matriz inversa. En particular, para que una aplicación lineal sea 
invertible es necesario y suficiente que sea invertible su matriz. 

De nuestros resultados también se desprende directamente la 
siguiente regla: la matriz de la aplicación A" es igual a A", donde 
A es la matriz de la aplicación A. 


9,2, Multiplicación por número y adición. En este punto y en 
el que sigue se supone que el cuerpo principal K es un cuerpo con- 
mutativo. La aplicación que resulta al aplicar a un vector primero 
la aplicación 4 y al multiplicar después el vector nuevo por un 
número « se llama producto de a por Æ y se indica por a4. Esta 
definición se puede expresar mediante la fórmula 


x(a4) =a (14). 

Razonando igual que en el caso de la multiplicación de aplica- 
ciones lineales, veremos fácilmente que siendo 4 una aplicación 
lineal, también œA es una aplicación lineal. Determinemos su matriz. 
Supongamos que en un sistema de coordenadas fijado la aplicación 
ví tiene la matriz A y la aplicación ad tiene la matriz B. Según 
la regla de una aplicación línea), tenemos 

[x(a4)]=[x]B y 
[* (a4)] = [a (x4)] =a [x4] =a [x] A = [x] (0.4), 
de donde resulta que [x] B= [x] (=A), es decir, B=a4. 
Luego, la matriz del producto de un número por una aplicación 


lineal es igual al producto de este número por la matriz de la apli- 
cación, 


Indiquemos, finalmente, las fórmulas 
a (B4) = (ap) 4, 
0.4=0, 
LA=4, 
a (AB) = (24) B= A (4B), 
análogas plenamente a las fórmulas correspondientes del cálculo de 
matrices. La demostración queda a cargo del lector. 
Tomemos ahora dos aplicaciones 4 y B de un espacio lineal L 
y pongamos en correspondencia a todo vector x de Q el vector 
x4+x8. La aplicación que transforma x en x4-+x%8 se indica 


91843 
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por Æ4+B y se denomina suma de 4 y B. Es decir, por definición, 
MATH BB) = xA FIB. 
Si las aplicaciones Z y B son lineales, se tiene 


(ax + By) (4+ B) = (ax + Py) 4A -+ (ax + By) B = 
=a 144 B yA Ha xBHB-YBR= 
=a (xA +xB)+Bl(yA HYB) =0-x (A+ B)+B AHB) 
Por consiguiente, /a suma de dos aplicaciones lineales es una apli- 
cación lineal. Determinemos su matriz. Sean A y B las matrices de 


las aplicaciones 4 y B en un sistema de coordenadas. Sea C la 
matriz de la aplicación 4+8. Tenemos 


(x(442)] =(x]C, 


Ec 2N=lt4<0)>. [x4]+1[x8]=(x] A+ [x] B= [x] (A -+ B). 
'or consiguiente, 

[C=[x](44+B) y C=A+B, 
es decir, la matriz de una suma de aplicaciones es igual a la suma 
de sus matrices. 

Las operaciones con aplicaciones lineales se rigen por las mismas 
leyes que las operaciones con matrices. Una parte de ellas, las rela- 
cionadas solamente con la multiplicación, ya las hemos indicado. 
Señalemos ahora también aquellas que se refieren o bien a la adi- 
ción o bien a las relaciones entre la adición y multiplicación: 


AR4B=B HA, 
(44+8)+8 =A+(B+8), 
4A+0=4, 
(A+ B)=04 +08, 
(+B) A = at Pa, 
A(B46)=A1BHA8, 
(148) 6 = AE +88. 


Todas estas igualdades se demuestran siguiendo un mismo método: 
se toma un vector arbitrario x y se demuestra que la aplicación 
que figura en el primer miembro transforma x en el mismo vector 
en el que lo transforma la aplicación que figura en el segundo 
miembro. Por ejemplo, 


XA BRE) = (14) (B+E) = (44) BH XA) €, 
(ABH AE) =x (AB) +x (A8) = (XA) B+ (Xd) E, 


de donde resulta que 4(B4+-8)=4B4 48. 
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Todas estas leyes también se pueden deducir directamente de las 
fórmulas correspondientes del cálculo de matrices. En efecto, existe 
una correspondencia biyectiva entre las matrices cuadradas de orden n 
y las aplicaciones lineales de un espacio lineal de n dimensiones. 
Esta correspondencia posee la propiedad de transiormar la suma en 
la suma y el producto en el producto. Por esto, toda identidad 
entre matrices implica una identidad análoga entre aplicaciones li- 
neales, que es lo que se quería demostrar. 


9.3. Polinomios en aplicaciones lineales. Sea 
10)=0 +0 +... +0 
un polinomio en la variable A. La expresión 
HA =4É +4 AH. Pad”, 
donde $ es la aplicación idéntica y 4 es una aplicación cualquiera, 
se llama valor del polinomio f(A) para A=.4 o simplemente poli- 
nomio en 4. Si la matriz de la aplicación A en un sistema de coor- 
denadas es igual a A, la matriz de la aplicación f (4) en este mismo 
sistema de coordenadas es 
F4A)=E+ a A+... +0. 4”. 

Efectivamente, f (4) se obtiene de 4 mediante las operaciones de 
multiplicación, de multiplicación por número y de adición. De los 
resultados señalados anteriormente se ve que realizando estas mismas 
operaciones con la matriz A se obtiene la matriz de la aplicación f (4). 

Todas las reglas de operaciones con polinomios en una 
variable tienen lugar también para los polinomios en una aplicación 
lineal. Por esto, si en alguna identidad entre polinomios en A se 
sustituye À por una aplicación lineal, se obtiene una relación verí- 
dica. Por ejemplo, de las identidades 

Pi=(A1) (+1) y AHIPA IPA =2 

se obtiene realizando la sustitución A=.1 


AE =(A—8) (A +68) y 
A (A+ +(A—ÉP— 2A =26. 
En particular, la identidad 
10)20=2 (M0) 


KOEI =EL li 


que significa que los polinomios en una misma aplicación lineal 
siempre conmutan. 

La situación resulta diferente en el caso de polinomios en varias 
variables. Esto se debe a que en los cálculos con los polinomios se 


implica la relación 
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acepta que las variables conmutan. Por esto tenemos, por ejemplo, 
las igualdades A4A=2%L, Au?àp = Ap", etc. 

Sustituyendo en estas igualdades las variables 4 y p por unas 
aplicaciones lineales arbitrarias 4 y 2, obtenemos las relaciones 


ABAS PR y APAB= MAB 


que pueden resultar falsas para determinadas aplicaciones lineales. 
Está claro que estas dificultades desaparecen, si las aplicaciones 
consideradas conmutan. Por consiguiente, en toda identidad entre 
polinomios en varias incógnitas se pueden sustituir estas incógnitas 
por aplicaciones lineales arbitrarias que conmutan, obteniéndose 
como resultado una relación verídica entre aplicaciones lineales. 

Hemos convenido en que todos los espacios que se consideran 
en este libro son de dimensión finita. Sin embargo, esto no excluye 
el hecho de que una parte de definiciones y de teoremas tenga lugar 
también para los espacios de dimensión infinita. A título de ejemplo, 
podemos señalar las defi: es de aplicaciones lineales y de las 
operaciones con las mismas y aquellas propiedades de las aplicacio- 
nes lineales, expuestas en este parágrafo, que no están relacionadas 
con matrices. 


Ejemplos y problemas 


1. Sea & el conjunto de todos Jos polinomios en A de grado <n. Sea D la 
aplicación que transforma todo polinomio f (%) en su derivada /” (A). Demuéstrese 
que ¿D"+1=G, Hállese la matriz de D en el sistema de coordenadas 1, A,..., A". 

2. Sea € el espacio de dimensión infinita de todos los polinomios en A. In- 
diquemos por €D la operación de diferenciación y por @ la operación de multi- 
plicación, de polinomios por A. Demuéstrese que ambas operaciones son lineales 
y que están ligadas por las relaciones 


E€D-DE SNE (n=1,2, ...), 


3. ¿Por qué no se puede considerar la aplicación Y, indicada en el problema 
anterior, en el espacio de polinomios de grado mo mayor de ni 

4. Las aplicaciones lineales de un espacio € forman, respecto a les operacio- 
nes de adición y de multiplicación por número, un espacio lineal. ¿Cuál es la 
dimensión de este espacio, si la dimensión de Ê es igual a n? 


$ 10. Rango y defecto de una aplicación lineal 


Hasta el momento hemos considerado aquellas propiedades de las 
aplicaciones lineales que se refieren principalmente a las reglas de 
las operaciones con las mismas. Estudiemos ahora algunas propie- 
dades de carácter más bien geométrico. 


10.1. Núcleo y dominio de valores. Sea M un conjunto de vec- 
tores de Espa] lineal E y sea Æ una aplicación lineal cual- 
quiera del último. Todo vector a de M se transforma por la apli- 
cación lineal «4 en un nuevo vector a4 que es la imagen del 
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vector a. En general, esta imagen no pertenecerá a M. El conjunto 
de las imágenes de todos los vectores de Y se llamará imagen de M 
respecto de «£ y se indicará por Wi.2. Convendremos en llamar ima- 
gen recíproca del conjunto M el conjunto de todos los vectores de Y 
cuyas imágenes pertenezcan a D. 

TEOREMA 1. Las imágenes y las imágenes recíprocas de los subespa- 
cios lineales de un espacio Y respecto a una aplicación lineal cual- 
quiera A son también subespacios lineales. 

En efecto, sea A un subespacio lineal de £. Mostremos que A.Z 
es también un subespacio lineal. Tomemos en MZ unos vectores « 
y b cualesquiera. Estos vectores son las imágenes de unos vectores x 
e y de M, es decir, a=x4 y b=y4. Puesto que A es un subes- 
pacio lineal, el vector ax + fy pertenece a A cualesquiera que sean a 
y B. Por ello, el vector (ux-+ By) ul también pertenece a Ax. Pero 
tenemos 


(ax+ Py) Awa xt +B- yal = aat pb, 


es decir, A.4 contiene el vector aa-+Bb y, por consiguiente, es un 
subespacio lineal. De forma análoga se demuestra también que la 
imagen recíproca de un subespacio lineal % es un subespacio lineal. 

Se llama núcleo de una aplicación lineal 4 el conjunto de to- 

dos los vectores de £ que se transforman por la aplicación 4 en el 
vector nulo y se llama dominic de valores de «l el conjunto de las 
imágenes de todos los vectores de Q, La dimensión del dominio de 
valores se llama rango de la aplicación y la dimensión del núcleo 
se llama defecto de la aplicación. 

TEOREMA 2. La suma del rango y del defecto de una aplicación 
lineal A es igual a la dimensión del espacio X. 

Indiquemos por M el núcleo de la aplicación «ż y supongamos 
ue d es la dimensión del núcleo N. Indiquemos por r la dimensión 
lel dominio de valores 24. Por definición, d y r son, respectiva. 

mente, el defecto y el rango de la aplicación «Z. Tomemos en el 


dominio de valores QZ una base a,, aj .-., a, Y sean by, bo ..., b, 
unos elementos dei espacio £ que se transforman por la aplicación Z 
en dy ap ..., a, respectivamente. Los vectores by, Dj, ..., D, son 


linealmente independientes, ya que de la relación 


aba. Hab, =0 
se deduce que 
(ab, tabt. Hab) dl =0,0 40044 440,0, 
y, puesto que a,, 4,, ..., a, son linealmente independientes, se tiene 


a =a,=... =a, =0. 


Consideremos el subespacio M tendido sobre los vectores b, h, 
-.., b, El sistema b, ..., b, es una base de M y por eilo la 
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dimensión del subespacio M es igual a r, es decir, al rango de la 
aplicación 4. Demostremos que el espacio £ es la suma directa de 
los subespacios W y N. Para ello es suficiente demostrar, según el 
p. 6.2, que ll y que L=% 4. Demostremos lo primero. 
Todo vector de M es de la forma 


b=abi tabt... Habr 
Si b pertenece a N, se tiene b es decir, 
abit- +ab) A =aa, +. Haa, m0. 
Pero los vectores a,, ..., a, son linealmente independientes y por 
esto a,=...=0,=0, de modo que b=0 que es lo que se quería 
demostrar. Resta probar que =M -+N. Tomemos un vector cual- 


quiera a de £. Su imagen a pertenece a LA y, por consiguiente, 
se expresa linealmente en términos de a,, a 


ad =0,0,+0J0,+... 40,0). 
Sea 
b=ab tabt... +ab, y a—b=c. 
Puesto que 


bl=0 bt +...+0,bd=0,0,+...+0,9,=04, 


se tiene 
cd =(a—0) A =al —bd =0. 


Por consiguiente, c pertenece a N. Es decir, tenemos 
a=b4+c (bEM, ced); 
pero esto significa precisamente que 


L£=M4N. 


Como que esta suma es directa, la dimensión del espacio Q es igual 
a la suma de las dimensiones de los subespacios Wi y N, es decir, 
es igual a la suma del rango y del defecto de la aplicación 4. 
Hemos demostrado el teorema. 

Consideremos un ejemplo. Sea N el espacio corriente de los seg- 
mentos orientados que parten de un punto O. Tomemos un plano 
cualquiera $ que pase por el punto O e indiquemos por P la ope- 
ración de proyección ortogonal sobre B. La aplicación P transforma 
todo el espacio N en el plano $. Es decir, $ es el dominio de va- 
lores de la aplicación P y el rango de P es igual a 2. El núcleo 
de la aplicación P está compuesto por los vectores que pertenecen 
a la recta que pasa por el punto O y que es perpendicular al 
plano $, ya que solamente estos vectores son transformados por la 
aplicación P en el nulo. Por consiguiente el defecto de P es igual 
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a 1. La suma del iango y del defecto de la aplicación P es igual 
a 3 tal y como debe ser según el teorema 2. 


10.2. Aplicaciones singulares y regulares. Más arriba (en el 
p. 9.1) hemos señalado que no toda aplicación es invertible. En lc 
sugesivo las aplicaciones lineales invertibles serán llamadas regulares, 
mientras que las aplicaciones no invertibles se llamarán singulares. 
En el p. 9.1 hemos encontrado en forma matricial las condiciones 
que garantizan que una aplicación lineal sea regular. Queremos dar 
ahora a estas condiciones un carácter geométrico. 


TEOREMA 3. Para que una aplicación lineal A de un espacio & 
sea regular es necesario y suficiente que el núcleo de esta aplicación 
sea nulo, es decir, que el defecto de A sea igual a cero. 


DEMOSTRACION. Si la aplicación dada ut es regular, todo vector 
debe tener sólo una imagen recíproca; en particular, sólo una ima- 
gen recíproca debe tener el vector nulo o. Puesto que o siempre es 
una imagen reciproca del vector nulo y puesto que en este caso el 
núcleo está compuesto sólo de un vector, éste será precisamente el 
vector 0. 

Viceversa, sea el defecto de 4 igual a cero. En virtud del teo- 
rema 2, de aquí se deduce que el rango de 4 es igual a la dimen- 
sión de £, es decir, que la dimensión del dominio de valores 
QA es igual a la dimensión de £. Por consiguiente, Q4 =%; vemos, 
pues, que todo vector de € es la imagen de un vector de L. Si de- 
mostramos que la aplicación 4 transforma diferentes vectores a y b 
en diferentes vectores, esto significará precisamente que la aplica- 
ción Æ es invertible (p. 7.3). Pero de a4=b4 se deduce que 
(a—b) A =0. Puesto que, por hipótesis, el núcleo de 4 es nulo, 
tenemos a—b=0, es decir, a=b que es lo que se necesitaba. Hemos 
demostrado el teorema. 

La igualdad a cero del defecto de 4 equivale a la coincidencia 
del rango de 4 y de la dimensión del espacio £. Por ello, el teo- 
rema 3 puede ser enunciado también en la forma siguiente: 

TEOREMA 4. Para que una aplicación lineal 4 de un espacio & 
sea regular es necesario y suficiente que el dominio de valores de vt 
coincida con Q, es decir, que el rango de A sea igual a la dimen- 
sión de L. 

Una aplicación biyectiva de un espacio lineal sobre otro se de- 
nomina isomorfismo, si transforma una suma de vectores del primer 
espacio en la suma de los vectores correspondientes del segundo 
espacio y si transforma, además, el producto de un número por un 
vector del primer espacio en el producto del mismo número por el 
vector correspondiente del segundo espacio (p. 4.3). Si ambos espa- 
cios lineales coinciden, obtenemos una aplicación isomorfa de un 
espacio lineal sobre sí mismo. Toda aplicación de este tipo se llama 


136, Cap. 111. Aplicaciones lineales 


automorfismo de un espacio lineal. La definición de automorfismo 
coincide, obviamente, con la definición de una aplicación lineal 
regular. Por consiguiente, las aplicaciones lineales regulares de un 
espacio £ pueden ser consideradas como automorfismos de este espa- 
cio. De la definición misma de automorfismo resulta que los auto- 
morfismos de un espacio * son aquellas superposiciones del espa- 
cio £ sobre sí mismo que conservan todas sus propiedades geométricas, 
es decir, las propiedades que se enuncian en términos de las opera- 
ciones de adición y de multiplicación por número. 

Consideremos dos aplicaciones lineales arbitrarias 4 y B de un 
espacio £. Convendremos en llamar estas aplicaciones isomorfas o 
semejantes, si existe un automorfismo $ del espacio Q que transfor- 
ma una aplicación en la otra. 

Sea u un vector de £ y sea u=u4. El automorfismo 8 trans- 
forma u en un vector x y ven un vector y. Se dice que € trans- 
forma la aplicación 4 en B, si xB=y (véase la fig. 3). Puesto 
que x=u8 e y=u6, de la igualdad xB =y resulta 


UEB=WE y BBE- =0=U4. 
De aquí 
EBE-'=A y BEE. 0) 


Por consiguiente, una aplicación B es isomorfa a una aplicación A 
si, y sólo si, se obtiene transformando AL por un automorfismo del 
espacio Q, es decir, por una aplicación regular de este espacio. 

Tomemos en £ un sistema de coordenadas y sean A, B y C 
las matrices respectivas de las aplicaciones 4, B y 6. Entonces 
la igualdad (1) equivale a la relación matricial 


B=CAC 


y llegamos a la siguiente conclusión: para que dos aplicaciones li- 
neales de un espacio Q sean isomorfas es necesario y suficiente que sus 
matrices sean semejantes. 

Debemos considerar las aplicaciones isomorías como aplicaciones 
que tienen las mismas propiedades geométricas. De aquí la impor- 
tancia de saber clasificar, salvo un isomorfismo, todas las aplica- 
ciones lineales. Algebraicamente este problema equivale a la clasi- 
ficación, salvo semejanza, de todas las matrices cuadradas de orden n. 
El problema de clasificación de todos los espacios lineales sobre 
un cuerpo dado se resuelve sin dificultad (véase el p. 4.3); en 
cambio, el problema de la clasificación de las aplicaciones lineales 
exige para su resolución un estudio más detallado de las propieda- 
des de las aplicaciones lineales. Este problema quedará totalmente 
resuelto sólo en el capitulo siguiente. 

Señalemos, para concluir, una propiedad más de las aplicaciones 
lineales isomorias: para que las aplicaciones lineales A y B sean 
isomorfas es necesario y suficiente que existan unos sistemas de coor- 
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denadas en los que estas aplicaciones se representen por una misma 
matriz. 

En efecto, si 4 y B son isomorfas, sus matrices están ligadas 
por la relación A=CBC-!. Pero esta relación muestra que, si pa- 
samos del sistema de coordenadas dado a otro de manera que la 
matriz del cambio sea C, la matriz de la aplicación B en el nuevo 
sistema de coordenadas será A, es decir, coin á con la matriz 
de la aplicación 4 calculada en el sistema antiguo de coordenadas. 
Viceversa, si la matriz A de la aplicación ul en el sistema de coor- 
denadas a,» ..., a, Coincide con la matriz de la aplicación 3 cal- 
culada en el sistema de coordenadas a;, ..., a y si C es la matriz 
del cambio del primer sistema de coordenadas por el segundo, ten- 
dremos que las matrices de las aplicaciones 4 y B en el segundo 
sistema de coordenadas serán iguales, respectivamente, a CAC”! 
y a A, es decir, serán semejantes, que es lo que se quería demostrar. 


(Ay + 000) + +. + nan) A = 0% (0,4) + 0 (agt) + +. > + On (0 pul). 

De aquí se desprende que el dominio de valores de la aplicación 
A es el subespacio tendido sobre los vectores at, ..., Apu. 
„El rango de Z es igual a la dimensión del dominio de valores y, 
por consiguiente, al número máximo de vectores linealmente inde- 
pendientes entre los vectores a4, ..., al (p. 6.1). Sea 

at =a Hag H 0 H is 

ayl = ap, + gado +- 


Ont = 0101 E Amâ, H E lo 
La matriz 
Ly Tiz an] 
Aa tn Oa a 


es la matriz de la aplicación Z. Las filas de esta matriz son 


as 
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filas de coordenadas de los vectores a4, s „A. Luego, el nú- 
mero máximo de vectores linealmente independientes entre los 
vectores avl, ..., GAL es igual al número máximo de filas lineal- 
mente independientes de la matriz A, es decir, es igual a su rango 
que es lo que se quería demostrar. 

Se ilama defecto de una matriz cuadrada la diferencia entre su 
orden y su rango. De los teoremas 2 y 5 se desprende directamente 
que el defecto de una aplicación lineal es igual al defecto de su matriz. 

. Consideremos a título de ejemplo un sistema de n ecuaciones lineales homo- 
géncas 


Bian Enola H + + Ens 0, 
tiaa Herat... lts =0, dj 


Eint atant- - Eno =0, 


con n incógnitas Er. En, .»., En- Queremos estudiar las soluciones de este siste- 
ma. Geométricamente este problema puede ser interpretado de la forma siguiente. 
Tomemos un espacio lineal cuaiquiera € de n dimensiones y escojamos en él un 
sistema de coordenadas 01, ..., Gp» Convengamos en interpretar las magnitudes 
incógnitas Bi yrz En somo las céordenadas de un vector x de €. Consideremos 
la aplicación lincal "yl de este espacio cuya matriz A está compuesta por los 
elementos ayy (f, jul, 2, ..., n). El sistema de ecuaciones (2) puede ser re- 
presentado en la forma 


LxJA=0 
© en la forma vectorial 
xA=0. 


De aqui se ve que las soluciones del sistema (2) son las filas de coordenada 
de los vectores pertenecientes al núcleo de la aplicación „€. Puesto que la di- 
mensión del núcleo coincide con el defecto de la aplicación y el defecto de la 
aplicación es igual al defecto de su matriz, llegamos al conocido, teorema de Ja 
teoria de los determinantes: el número máximo de soluciones linealmente indepen- 
dientes de un sistema homogéneo de n ecuaciones lineales con n incógnitas es igual 
al defecto de la matriz de este sistemu. 


Ejemplos y problemas 
dal’ En el espacio de filas de longitud 4 se ha tomado el sistema de coorde- 
nadas 
e=), 0, 0, 0), ez=[0, 1,0, 0), es=[0,0,1,0] y es=[0,0,0, 1]. 


Háltense el núcleo y el dominio de valores de las aplicaciones fineales definidas 
por las matrices 


2 2100 31 1 351 
o 210 21 2 13i 
34» 20]: oof js 7133]: 
0 o, 00. 3-1 11 


2. Sea A una aplicación lineal de un espacio @ y sea M un subespacio 
lineal de €. Demuéstrese que la dimensión de la imagen del subespacio UN sa- 
tisiace las desigualdades 


dim. M—del. yl < dim. MA < dim. M. 
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3. Si ulx y a son unas aplicaciones lineales arbitraria y regular, respec- 
tivamente, se fiene 
rango (rula) =rango (uladi) = rango ui. 


4. Sean vli y els unas aplicaciones lineales cualesquiera de un espacio li- 
neal Ẹ. Entonces se tiene 


rango (Ai -H Ay) <= rango ul + tango ula, 
del. (MA) <Údel. A+ el. Aa 
rango (A Az) < rango ul, y rango (ul1dl¿) < rango ula 
5. Toda aplicación lineal de rangom puede ser septosentada an’ forma de 
una suma de aplicaciones de rango L. 
6. Para que una matriz A de orden n tenga el rango no mayor que 1 es 
necesario y suficiente que A pueda ser representada en lo forma 


Bal = ll By ih 
An. 
donde a; y fi; son números determinados. 
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11.1. Aplicación inducida. Se dice que un subespacio A de 
un espacio lineal Y es invariante respecto a una aplicación v? si todo 
vector de Y se transforma por la aplicación .4 de nuevo en un 
vector de Ml, es decir, si 

UCA. 


De esta definición se desprende directamente que los subespacios 
impropios (el subespacio nulo y el propio espacio £) son invarian- 
tes respecto a cualquier aplicación lineal. También directamente 
se deduce la proposición de que toda suma y toda intersección de 
subespacios invariantes es de nuevo un subespacio invariante. 

Observemos además que siendo un subespacio A invariante res- 
pecto a una aplicación A, A también será invariante respecto a 
la aplicación f(4), donde [(A)=%6 +a t... fat” es un 
polinomio arbitrario en A. 

En efecto, si a es un vector de A, el vector av? está contenido, 
por hipótesis, en Y. De aquí se deduce que (a4) 4=a* está 
contenido en A, etc. Vemos, por consiguiente, que el vector att 
pertenece a A cualquiera que sea k>0. Pero en este caso A con- 
tiene también todas las combinaciones lineales de estos vector 
en particular, Y contiene el vector 


af(d)=0,Ja +0 0d +. +0 adn, 


que es lo que se quería demostrar. 
Los métodos de determinación de los subespacios invariantes 
serán considerados en el p. 11.4 y en et $ 12 ahora, queremos 
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sólo explicar cómo se pueden aprovechar los subespacios invarian- 
tes para simplificar la matriz de una aplicación. 

Sea A un subespacio invariante no trivial de una aplicación 
lineal Z. Tomemos en A una base a,, a, ..., a, complementán- 
dola con vectores linealmente independientes 4,,,,, ..., 4, hasta 
obtener una base de todo el espacio £. Para hallar la matriz de 
la aplicación 4 en el sistema de coordenadas 2,, ..., Am mtu 

+» a, es necesario expresar linealmente los vectores a, ..., a, Æ 
en términos de los vectores coordenados a,, ..., a,. Pero el subes- 
pacio % es invariante y, por ello, los vectores 2,4, ..., And 
pertenecen de nuevo a A y se expresan linealmente en términos 


de a,, + An. Por consiguiente, tenemos 
al =0aa, ++. Famam 
anl Sant, +.. H annin 0) 
Ont = ams H o H a H o H Amga, nin 
Arl = Al, E A A LA 
es decir, la matriz de la aplicación Z es igual a 
A ias: Gi 0 A) 
A A A] A] 4,0 
A A A A AS 
Ln ee Ona Omas +e Can j 


Resumiendo, si una aplicación lineal posee un subespacio lineal 
invariante, su matriz en un sistema de coordenadas adecuado se 
descompone en cuatro células con la particularidad de que las célu- 
las diagonales son cuadradas, mieniras que la célula superior de 
la derecha puede resultar rectangular, pero formada integramente 
por ceros. Las matrices de este tipo han sido llamadas en el p. 2.1 
Semidescompuestas. Reciprocamente, si en un sistema de coordenadas 
la matriz de una aplicación lineal «Z tiene la forma semidescom- 
puesta (2), las igualdades (1) muestran que en este caso el subes- 
pacio A tendido scbre los m primeros vectores coordenados será 
invariante respecto de .£. 
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Geométricamente la matriz A, puede ser interpretada de modo 
siguiente. Tenemos que la aplicación 4 transforma todo vector 
de A de nuevo en un vector de A. Por esto Z puede ser conside- 
rada también como una aplicación del espacio A. Indiquemos esta 
aplicación por 4, y convengamos en llamar 4, aplicación inducida. 
Las aplicaciones 4 y «4, actúan sobre los vectores del subespacio 
Y idénticamente: sia es un vector de A, se tiene a4=44,. La 
diferencia entre estas aplicaciones consiste en que tienen distintos 
campos de definición: si a es un vector del espacio principal Q 
que no pertenece a A, la operación ax tiene sentido, mientras 
que ad, no lo tiene. 

Las primeras m igualdades del sistema (1) muestran que A, es 
la matriz de la aplicación inducida 4, en el sistema de coordena- 
das Aj, Aj, >see Gpo 


11,2. Suma directa de subespacios invariantes. Hemos conside- 
rado el caso en que la aplicación lineal 4 tiene sólo un subespacio 
invariante. Supongamos ahora que Æ posee dos subespacios inva- 
riantes A, y A, y, es más, supongamos que el espacio $ es la suma 
directa de estos subespacios. Tomemos en A, y A, unos sistemas 
de coordenadas a, ..., Om Y msi ===» Qa respectivamente. Según 
el p. 6.2, los vectores a, ..., Gms amsi» += +» Gn forman un sistema 
de coordenadas de L. Veamos la forma que toma en este sistema la 
matriz de la aplicación A. Por hipótesis, los vectores a4, ..., A/A 
pertenecen a U, y los vectores ampf, ..., Ort pertenecen a Y. 
Luego, tenemos 


aA = ana, +... Hmla 


Oph m amn F -+ F tania 
at= | 9 
at= C EE E A A 


Por consiguiente, la matriz de la aplicación .£ resulta ser igual a 


fon ++ Am 0 sn 0 

cria ¡a esa 0 A, 0 
A A E 

Lo O an ms Can j 
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es decir, resulta ser descompuesta. Sean 4, y 4, las aplicaciones 
inducidas en los subespacios X, y M, por la aplicación 4. De las 
igualdades (3) se deduce que A, y A, son las matrices de las apli- 
caciones ul, y «Af, en los sistemas correspondientes de coordenadas. 

Resumiendo, si un espacio & se descompone en una suma directa 
de subespacios invariantes respecto a una aplicación lineal A, la 
matriz de la aplicación A calculada en un sistema adecuado de coor- 
denadas toma la forma celular diagonal y sus células diagonales 
representan las matrices de las aplicaciones inducidas por la aplica- 
ción A en los subespacios invariantes. 

Hemos demostrado esta proposición sólo en el caso de una suma 
de dos subespacios invariantes. Sin embargo, todos los razonamien- 
tos se traspasan sin modificaciones al caso de un número arbitrario 
de sumandos. 

Supongamos ahora lo contrario aceptando que en un sistema de 
coordenadas la matriz de la aplicación 4 toma la forma descom- 
puesta (4). Entonces de las igualdades (3) se desprende que el espa- 
cio A, tendido sobre los m primeros vectores coordenados y el 
espacio A, tendido sobre los restantes vectores coordenados serán 
invariantes respecto de 4. Es obvio que la suma A, +% es directa 
y coincide con £. Por consiguiente, la condición de que la matriz 
de la aplicación 4 se reduce a la forma celular diagonal, además 
de ser necesaria, es también suficiente para que £ sea la suma di- 
recta de los ai espacloe invariantes respecto de 4. 

Examinemos el problema siguiente. Se tiene una descomposición 
de un espacio £ en la suma directa de unos subespacios lineales 


20, +9, +... +9, 


y en cada subespacio A, se tiene una aplicación lineal 4,. ¿Existe 
una aplicación lineal 4 del espacio Q respecto a la cual todos los 
subespacios A, son invariantes y que induce en todo YA, la aplica- 
ción 4¡? ¿Será esta aplicación única? La respuesta es, obviamente, 
afirmativa. En efecto, tomemos en cada uno de los subespacios A, 
una base ai, Qim -e.s Gim, € indiquemos por A; la matriz de la 
aplicación 4, en este sistema de coordenadas. Consideremos la ma- 
triz celular diagonal 


ASA HA +...+4As. 


El sistema formado por los vectores a, ---, Qmp ->+ Ayp 00 <> Lam, 
es una base del espacio Q. En esta base ala matriz A le corres: 
ponde una aplicación lineal 4 del espacio £. En virtud de lo 
expuesto anteriormente, la aplicación 4 satisface todas las condi- 
ciones de nuestro problema. Esta aplicación es unica, ya que su 
matriz en el sistema de coordenadas indicado se c «termina univo- 
camente por las condiciones del problema. 
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11.3. Polinomio característico de una aplicación. En este punto, 
así como en el siguiente, sesupone que el cuerpo principal es un cuer- 
po conmutativo. Tomemos una aplicación lineal cualquiera 4 de 
un espacio lineal £ de n dimensiones. Escogiendo en £ un sistema 
de coordenadas determinado a,, podemos calcular la matriz 
A de la aplicación «4. El polinomio característico p (A) =|2£ —A| 
de la matriz A se llama polinomio característico de la aplicación A. 
Si tomamos otro sistema de coordenadas a;, ..., a, e indicamos 
por T la matriz del cambio, la matriz de Ja aplicación 4 en el 
nuevo sistema de coordenadas será, de acuerdo con el p. 8.3, la 
matriz 


Aj=TAT=, 


es decir, la matriz semejante de A. Sin embargo, en el p. 3.2 he- 
mos demostrado que las matrices semejantes tienen los mismos po- 
linomios característicos. Por consiguiente, el polinomio característico 
de una aplicación A no depende del sistema de coordenadas en el que 
se calcula. 

El grado del polinomio característico es igual al orden de la 
matriz A y el orden de la matriz A es igual a la dimensión del 
espacio &. Por esto, el grado del polinomio característico de una 
aplicación. 4 es igual a la dimensión del espacio en el que actúa 
esta aplicación. 

La suma de las raíces del polinomio caracteristico es igual a la 
traza y el producto de las raíces es igual al determinante de la 
matriz A. Puesto que el polinomio característico de 4 y, por con- 
siguiente, también sus raíces no dependen del sistema de coorde- 
nadas, tampoco la traza y el determinante de A dependerán del 
sistema de coordenadas. Por esta razón la traza y el determinante 
de la matriz de una aplicación 4 se llaman traza y determinante de 
la DTi A. 

i el espacio se descompone en una suma directa de los 
subespacios Y, y A, invariantes respecto de 4, la matriz de la 
aplicación 4 toma, en un sistema de coordenadas adecuado, la forma 
celular diagonal PNS 

i 
aSo al 
Según el p. 3.3. el polinomio característico de la matriz A es igual 
en este caso al producto de los polinomios característicos de las 
matrices A, y A,. Pero A, y A, son las matrices de las aplicacio- 
nes lineales inducidas por la aplicación 4 en los subespacios inva- 
riantes A, y A,. Por lo tanto, si un espacio £'se descompone en la 
suma directa de subespacios invariantes respecto a una aplicación 
lineal A, el polinomio característico de la aplicación A es igual al 
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producto de los polinomios característicos de las aplicaciones inducidas 
por la aplicación A en los subespacios invariantes. 

Según el teorema de Hamilton—Cayley (p. 3.2), toda matriz 
cuadrada A es raíz de su polinomio característico p(2), es decir, 
$(4)=0. Sea Æ una aplicación lineal de matriz A. La matriz de 
la aplicación p(4) es, de acuerdo con el p. 9.3, (4). Como que 
esta matriz es nula, tenemos p (4)=6. Por consiguiente, toda apli- 
cación lineal es raiz de su polinomio característico. 

Se llama polinomio mínimo de una aplicación lineal A el poli- 
nomio de menor grado de coeficiente principal igual a 1 para el 
que la aplicación 4 es una raíz. Sea A la matriz de la aplicación 
«l calculada en un sistema de coordenadas. Puesto que las relacio- 
nes F(A)=0 y f(4)=6, donde f(À) es un polinomio arbitrario, 
son equivalentes, resulta que el polinomio minimo de una aplicación 
coincide con el polinomio minimo de la matriz de esta aplicación. 

Si el espacio £ se descompone en suma directa de subespacios 
invariantes respecto a una aplicación «£, la matriz de la aplicación 
vl, en un sistema de coordenadas adecuado, se descompone. El poli- 
nomio mínimo de una matriz descompuesta es el mínimo común 
múltiplo de los polinomios mínimos de sus células diagonales (p. 3.3). 
Por esto, el polinomio mínimo de una aplicación 4 será igual al 
mínimo común múltiplo de los polinomios minimos de las aplica- 
ciones inducidas por la aplicación «£ en los subespacios invariantes. 


11,4, Vectores propios y valores proj Continuemos suponiendo 
que el cuerpo pr al es un cuerpo conmutativo. Queremos ahora 
estudiar más detalladamente los subespacios invariantes de una di- 
mensión. Introduzcamos primero la definición siguiente. Un número E 
se llama valor propio de una AP lineal 4, si existe en el 
espacio £ un vector no nulo a, tal que 


al=ta. (5) 
“Todo vector que satisface esta relación se llama vector propio de la 
aplicación 4 correspondiente al valor propio E. 

La búsqueda de los vectores propios y la búsqueda de los subespacios 
invariantes de una dimensión son problemas equivalentes. Efectiva- 
mente, sea a un vector no nulo propio de una aplicación £ y sea b 
su valor propio correspondiente. Consideremos el subespacio de una 
dimensión U tendido sobre el vector a, es decir, el conjunto de todos 
los vectores de tipo «a. La relación 


(aa) A =a (44) =La-a (6) 


muestra que M es invariante respecto de £. Reciprecamente, sea Y 
un subespacio de dimensión uno invariante respecto de 4. Tome- 
mos en A un vector arbitrario no nulo a. Puesto que A es de una 
dimensión, todos los vectores de A son de la forma aa. Por hipó- 
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tosis, ad pertenece a A; luego, 
ad =La, 


es decir, a es un vector propio de la aplicación v£ correspondiente 
al valor propio £. La igualdad (6) muestra que todos los demás 
vectores de Y también son vectores propios correspondientes al va- 
Jor propio %. 

Escojamos en el espacio € un sistema de cuordenadas ay, .... a, 
y sea A=|0,,]| la matriz de una aplicación lineal «Z en este sis 
tema. Indiquemos por a algún vector propio no nulo de la aplica- 
ción Æ. Sea [E,, Es, ..., En] la fila de coordenadas del vector a y 
sea E el valor propio correspondiente. Pasando en la igualdad (5) 
a las coordenadas, obtenemos 


[a] A =$ [a], 1) 


bian +HErn ++ 
Erta Es + 


E En 
HE = EE. 


A f 6) 
Estan Estan H o oo H Entan = Gne 
Pasando todos los términos a un mismo miembro, obtenemos 
E Can) — Erta — Er =O, 
(9) 


| 
f 


Este sistema puede ser considerado como un sistema de n ecuacio- 
nes lineales homogéneas con 1 incógnitas ,, Es, ..., En. Puesto que 
las coordenadas del vector no nulo propio a satisfacen el sistema (9, 
tenemos (véase el p. 10.3) 


EA O + — 
e IA aA Tm [IRE A]=0, 10) 
Sam ana eer E — Ann 


donde E es la matriz unidad. Pero JAE — A| es el polinomio carac- 
terístico de la matriz A; por ello, de la igualdad (10) se desprende 
que todos “los valores propios de una aplicación lineal son raices de 
su polinomio característico. Recíprocamente, si É es una raiz del pu- 
linomio característico de una aplicación A que pertenece al cuerpo 
conmulativo de coeficientes del espacio lineal, resulta que L es un va- 
lor propio de la aplicación 1. En efecto, la igualdad (10) muestra 
que el rango de ta matriz del sistema (9) será menor que n; por 


10—1843 
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consiguiente, este sistema tendrá al menos una solución no nula. 
Indicando esta solución por [E,, E, ..., En], obtenemos directa- 
mente de (8) y de (7) que el vector a de coordenadas E,, Em ..., En 
será el vector propio no nulo deseado”. 

Se llama multiplicidad de un valor propio £ de una aplicación 
lineal Æ la multiplicidad que tiene £ como raíz del polinomio ca- 
racterístico de la aplicación 4. 

Consideremos un ejemplo. Supongamos que en el espacio lineal 
real de tres dimensiones de base a,, a, y a, actúa una aplicación 


lineal 4 de matriz 
3 3 2 
a-[ TA -2]. 
—3 —1 0. 


Se necesita hallar los valores propios y los vectores propios de la 
aplicación 4. Calculamos, ante todo, el polinomio característico de 
la aplicación 4: 


[= =3 —2 


—1 41 2 -o-o0r+o 
3 1 A 


Sus raíces son iguales a à, =4, a y A,=-—21, Puesto que el 
cuerpo principal es real, los dos últimos valores deben ser omitidos, 
mientras que el primer valor A,=4 será el valor propio buscado. 
Para hallar los vectores propios formamos el sistema (9) que, en 
nuestro caso, se convierte en . 


E—E, +3E, = 0, 
— 3h +3, +E, =0, 
— 2, 42,446, = 0. 


Resolviendo este sistema obtenemos 
E=5 y 5=0 


donde E, es arbitrario. Por consiguiente, el vector E,a,+E,a, será 
un vector propio de la aplicación 4 cualquiera que sea E. 


1 Existe una demostración más breve de la última proposición. La condi- 
ción ad Ea puede ser representada en la forma a (E — A) 20, Esto demuestra 
que los vectores propios de .A son vectores que pertenecen al núcleo de la apli- 
cación EP —.A. Pero, para que el núcleo contenga vectores no nulos es necesa- 
rio y suficiente que la aplicación sea singular (p. 10.2), es decir, es necesario 
y suficiente que sea |ĻE — A |=0. 
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Ejemplos y problemas 
1. En un espacio complejo L de base a, ap, a, y a, está definida una 


aplicación 4 de matriz 
EEE 

1 - 
Alo 1 o i| 


i2 -=i 


Hállense los vectores propios y los valores propios de la aplicación „€. Demuéstre- 
se que el subespacio tendido sobre los vectores 2a, —ay, y —a, -+a es invariante 
respecto de 4. $ 

2. Supongamos que un espacio € tiene una base formada por los vectores 
propios de una aplicación «4. ¿Cuál será la matriz de la aplicación A en esta 
ase? 

3. Si en un espacio € con un sistema de coordenadas ay, ay, 
matriz de una aplicación lineal „£ es de forma celular semidescompuesta 

A 8 

a=[% Ah 

donde A, es una matriz cuadrada de orden m, el subespacio tendido sobre los m 
últimos vectores coordenados an-m+1. -.., Gp será invariante respecto de „i. 

ASi la aplicación £ es regular, todo subespacio Invariante respecto de "vi 
también será invariante respecto de (—1, 

5. Si un subespacio Y es invariante respecto a una aplicación lineal 4, la 
Imagen y la imagen reciproca del subespacio M también serán invariantes res- 

cto de Al. 
Po. En un espacio linea! complejo toda aplicación lineal tiene al menos un 
vector propio no nulo, 

7. Supongamos que en un sistema de coordenadas ar, -.., de la matriz de 
pna aplicación ul es de forma diagonal con diferentes elementos diagonales, 
Hállense todos los subespacios invariantes de la aplicación „ y demuéstrese 
que el número de los mismos es igual a 2%, 

8. Si una aplicación lineal Y de un espacio @ de n dimensiones tiene n 
valores propios diferentes, la matriz de la aplicación „£ se reduce, en un sistema 
de coordenadas adecuado, a la forma diagonal. 


Ay la 
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En este parágrafo serán examinadas las propiedades de las 
aplicaciones lineales, cuyas matrices tienen, en un sistema de coor- 
denadas fijo, la así llamada forma normal de Jordan. Por consi- 
guiente, supondremos de antemano que las matrices de las aplicaciones 
consideradas pueden ser reducidas a esta forma. Más adelante, en 
el p. 15.4, veremos que esta reducción es siempre posible en el 
cuerpo de los números complejos. 

n todo este parágrafo se supone que el cuerpo principal es 
un cuerpo conmutativo, 


12.1. Forma diagonal. El teorema que sigue ofrece la caracte- 


rística más simple de las aplicaciones, cuyas matrices pueden ser 
reducidas a la forma diagonal. 
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TFOREMA 1 Si una aplicación lineal de un espacio de n dimen- 
siones tiene n vectores propius linealmente independientes, entonces 
tomándolos como vectores coordenados reduciremus la matriz de la 
aplicación a la forma diagonal. Reciprocamente, si la matriz de una 
aplicación en un sistema de coordenadas es de forma diagonal, los 
vectores de la base son vectores propios de la aplicación. 

La demostración es evidente. Un problema más sutil consiste 
en averiguar, a partir de la matriz de una aplicación calculada en 
un sistema de coordenadas eventual, si la aplicación posee vectores 
propios que constituyan una base del espacio. Este problema quedará 
resuelto en el p. 15.4, mientras que ahora estudiaremos sólo un caso 
particular del mismo, 

Teorema 2 Los vectores propios correspondientes a diferentes va- 
lores propios de una aplicación lineal son linealmente independientes. 

En electo, sean Pi, Pp ---> Pa distintos valores propios y sean 
Ay as...» Gn los vectores propios que les corresponden de una 
aplicación lineal Z. Por inducción, podemos aceptar que a,, 
son linealmente independientes. Supongamos que a, -. 
ligados por una relación 


AAA Hanim H Anm = O. 


Aplicando a ambos miembros de esta igualdad la aplicación v£, 
obtenemos 


sOy 
A, están 


AA mm 1 E An = 0 
Eliminando a,,, tendremos 
Ai PaP) A E Pan — Pina) nr =O. 


Debido a la independencia lineal de a, ...,@n-, de aqui resulta 
a=... =a- =0 y, por consiguiente, a, =0 que es lo que se 
quería demostrar. 

Comparando ambos teoremas demostrados, obtenemos el corolario 
siguiente: si el polinomio característico de una aplicación lineal de 
un espacio de n dimensiones fiene n diferentes raices, la matriz de 
la aplicación se reduce, en un sistema de coordenadas adecuado, a la 
forma diagonal. 

Por ejemplo, el polinomio característico de la matriz 


A E E 


—=11 3 
2 5 
E -2 


tiene las raíces + 1, +2; las filas de coordenadas de los vectores 
propios correspondientés son [2, 3, —5, — 4}. [0, 3, — 1, 4], 
[0, O, 4, 5] y [0, 0, O, 1]. Tomándolos como vectores coordenados 


A= 
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reduciremos la matriz A a la forma diagonal con los números 1, 
—1, 2 y —2 a lo largo de la diagonal principal. 


12.2. Células de Jordan. Una matriz de tipo 


A= (m 


se llama célula de Jordan, El polinomio característico de una célula 
de Jordan es igual a (—p)”, donde n es el orden de la matriz. 
Por consiguiente, p es su único valor propio de multiplicidad n. 

Sea Y un espacio lineal de base e,, e, ..., €, y sea A una 
aplicación lineal que en esta base tiene una matriz A de tipo (1). 
En este caso tenemos 


EA =Pe Hey... 
y, por consiguiente, 
e, (A—p) =en e APÉP =en -s e (4—pE)"- =en (3) 


Puesto que 4 debe ser una raíz de su polinomio característico, 
se tiene (4—98)" =0. El polinomio mínimo de la aplicación ./ 
divide su polinomio característico y, por ello, debe ser de la forma 
(A—0)', 0<s<n. La última de las igualdades (3) muestra que 
(4—P6)'=* +6, de manera que s=n, es decir, el polinomio minimo 
de una célula de Jordan coincide con su polinomio característico 
Ap). 

arios por 2, el subespacio tendido sobre los vectores £,, 
lie 0:21 €a (i=l, 2, ..., n) de la base. De las igualdades (2) y 
de la forma de la matriz A se deduce que todos esios subespacios 
son invariantes. Empleando las relaciones (3) es fácil comprobar que 
£, está compuesto por aquellos vectores, y sólo aquéllos, x para los 
cuales se tiene 


m =P F En EnA = pen (2) 


Md —péy =0. 
Esto demuestra que la cadena de subespacios L£=2,>2%,>5... 
,.+D%,>50 no depende de la selección del sistema de coordenadas 
y está definida por la propia aplicación 4- 
Demostremos que la aplicación no tiene otros subespacios invarian- 
tes. En efecto, sea Y un subespacio invariante de Z diferente de Y,. 
Busquemos un Índice í tal que MDL; y MP 2,.,, aceptando, para 


generalizar, que %,.,=0. Mostremos que Wat, Consideremos, 
Para ello, un vector arbitrario 
ASAR) Ajrit E Anta (a, 0) Ki 
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de Wi. Para ¡>1 tenemos a €%,. Supongamos que / < i. Aplicando 
a ambos miembros de (4) la aplicación (4—p6)'-/"*, obtenemos 


a(d pE} 0 Att an 412 EM. 


Puesto que, por hipótesis, e, ..., €, EMi, resulta que e; EM y, 
por consiguiente, %,_,M lo que contradice a la elección de Y. 
Por esto tenemos Mi de donde Mi=Y,. 

Observemos además que la matriz de la aplicación vl no se des- 
compone en ningún sistema de coordenadas. 

Efectivamente, la descomposición de la matriz de «4 equivale 
a la descomposición de £ en una suma directa de subespacios inva- 
riantes, lo que es imposible ya que uno de dos subespacios inva- 
riantes cualesquiera de la aplicación .1 debe estar contenido en el 
otro, mientras que los sumandos de una suma directa tienen inter- 
ción nula. 


12,3. Subespacios radicales. Las aplicaciones lineales, cuyas matri- 
ces pueden ser reducidas a la forma diagcnal o a una célula de 
Jordan, no abarcan todo el conjunto de maricón En el caso general, 
la matriz de cualquier aplicación lineal sobre el cuerpo de los nú» 
meros complejos puede ser reducida a la forma celular diagonal con 
células de Jordan a lo largo de la diagonal, Se dice que las matrices 
de este último tipo son de Jordan o que tienen la forma normal de 
Jordan. 

Supongamos que en una base e,, 
cación lineal .1 es de la forma nor 


+», €, la matriz de una apli- 
de Jordan 


Am A+A, 4 0 HA (5) 
donde A, es la célula de Jordan de orden n; con el valor propio 
pal, ...,5) y nit. Hnn, A la célula A, le corresponde 


el subespacio invariante X% tendido sobre los vectores €p,+11 Cp 421... 
oas ta (Mk Mi 9/=P +11). La aplicación «l induce 
en el subespacio £% 


Mi 

una aplicaci n sl; cuya matriz es precisamente 
la célula A,. Según Jo expuesto, todos los vectores x de Y“! satis- 
facen la relación 


vel —pn by =0 
y, por consiguiente, también la relación 


x(A—p 8)" 6 


Sin embargo, ahora ya no se puede afirmar que la relación (6) 
caracteriza sólo los vectores de £', ya que entre las células diago- 
nales pueden aparecer otras células con el mismo valor propio. Con 
el fin de examinar este problema más detalladamente, introduciremos 
la definición siguiente. 
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Un vector a se llama vector radical de altitud h correspondiente 
a la raíz p de una aplicación al, si 


a(pé—A)'=0. 


El concepto de vector radical es una generalización del concepto 
de vector propio, ya que los vectores propios son vectores radicales 
de altitud 1. 

El conjunto de todos los vectores radicales correspondientes a una 
raiz fija p de una aplicación A es un subespacio invariante &, llamado 
subespacio radical de la aplicación ul. 

Efectivamente, si x e y pertenecen a l, y son de altitud h, y 
h, tenemos para h= max (h, h) 


tax + By) (PE — A)" = ax (p — 4)" -+ By (PE — A)" = 0, 
xA (pE — AY = x (pS — AY A =0. 

Los vectores radicales correspondientes a diferentes raices son 
necesariamente lienealmente independientes. Es más, ticne lugar un 
teorema más general. 

TEOREMA 3. Si una suma xy 4 X,-4-... + Xp =x de vectores radi 
cales correspondientes a diferentes raices Pi» ..., Pm de la aplicación A 
está contenida en un subespacio invariante Wi, todo sumando por 
separado está contenido en W. 

Pongamos 


PM) =p MAY (A nm 
Por hipótesis, xp(4)E€M y, al mismo tiempo, 
APA) =P (A) = o =X (9 (u1) =0. 


Por consiguiente, xa(p(v() EM. Los polinomios (2) y (x—Ppp)'m 
son primos entre sí. Luego, existen unos polinomios F(A) y G0) 
ales que 

l= p (A) F ONH Op)" G 0), 
de donde 


E= pA) FAHA — pa) G (A) 
y, por consiguiente, 
Xn = XP (A) FA) A (APA Y" G (A) =X np (A) F (A) EM 


que es lo que se queria demostrar. 

La afirmación expuesta anteriormente acerca de la independencia 
lineal de los vectores X,, ..., Xa Se obtiene del teorema demostrado 
tomando M-=0. Como corolario notemos también que diferentes 
subespacios radicales tienen intersección nui 

Volvamos ahora al caso en el que la matriz de una aplicación 
.1 tiene en una base la forma normal de Jordan (5). Hemos definido 
más arriba dos series de subespacios: los subespacios radicales 
Lo +=.» Lom y los subespacios ¥%, ..., W9 correspondientes a las 
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células diagonales de la matriz A. Para explicar la relación que 
existe entre ambas series indiquemos por M® la suma de aquellos 
subespacios £ú que corresponden a las células con el valor propio p, 
y definamos análogamente W™, ...., DU. En virtud de ello, uniendo 
en la descomposición 


Leo Lu peo 
determinados sumandos obtenemos la descomposición 
LME, (7) 
Está claro que M%G2, (i=1, m). Por esto, además de (7), 
tiene lugar también Ta descomposición 
L= Lo + Lo +... + Lomo (8) 
Puesto que, en virtud del teorema 3, la suma (8) es directa, obte- 
nemos, comparándola con (7), las igualdades requeridas WU = Y p. 

Es decir, sí la matriz de una aplicación A puede ser reducida a 
la forma normal de Jordan, el espacio % es la suma directa de los 
subespacios radicales de «1 y, además, cada uno de los subespacios 
radicales es, a su vez, la suma directa de los subespacios correspon- 
dientes a las células de Jordan con el valor propio dado. 

Los razonamientos expuestos permiten ver también que los sub- 
espacios radicales se determinan univocamente por la propia apli- 
ión 4 y no dependen de la selección de la base de coordenadas 
€ ++. € En cuanto a los subespacios £', ellos dependen, en 
general, tanto de Æ como de la forma de reducción de la matriz 
a la forma diagonal. 


Ejemplos y problemas 
1. Supongamos que la aplicación Æ tiene en la base e, +... 0 la matriz 
Am A+ A+ A, donde acao $) y a=[o 3] Los subespacios radi- 


cales de „Z son Vom Ke, tKesj-KestKe, y Ur Kê- Kea (K es el cuerpo 
principal), mientras que LW =Ke, + Ke, y Kim Ke, + Key. En lo base nueva 


40 ERE mt mes me, y me, 


la matriz de A será la misma; sin embargo, los subespacio Kei + Kez y Kes- Ker 
correspondientes a la célnias de Jordan serán distintos. 
2 Hállense los polinomios minimos de las matrices 


(a EI EIT 


3. Una matriz sobre el cuerpo de los números complejos puede ser reducida 
a la forma diagonal si, y sólo si, su polinomio mínimo no tiene raices múltiples. 

4. Si la matriz de una aplicación puede ser reducida a la forma normal de 
Jurdan, lodo subespacio invariante suyo es suma directa de sus interseccio- 
nes con todos los subespacios radicales de la aplicación. 

5. Si una matriz de orden n tiene n diferentes números caracteristicos, la 
uplicación lineal correspondiente tiene un total de 2" subespacio: invariantes 
¡netayeudo el subespacio mulo y todo el espacio. 


o  _ QQ—o—e A A 
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Los elementos de casi todas las matrices que hemos estudiado 
hasta el momento eran números de un cuerpo principal K. Sin 
embargo, al introducir et concepto de polinomio característico nos 
hemos visto obligados a considerar la matriz característica EA, 
cuyos elementos no son números de K, sino polinomios en A con 
coeficientes de K, suponiendo, además, que K es un cuerpo conmu- 
tativo. En el capítulo presente nos ocuparemos del estudio sistemá- 
tico de las propiedades de las matrices polinomiales, es decir, de 
las matrices, cuyos elementos son polinomios en A con coeficientes 
de un cuérpo conmutativo principal. Aplicaremos después estos 
resultados al problema consistente en hallar la forma de Jordan de 
la matriz de una aplicación lineal. 


$ 13. Factores invariantes 


13.1. Equivalencia, Consideremos una matriz cuadrada de orden n 


E 0)... ro] 
PaO) oae fan) 
cuyos elementos son polinomios en la letra A con coeficientes de un 
campo principal K. Llamaremos las matrices de este tipo polino- 
miales o A-matrices . Frecuentemente resulta necesario realizar con 
A-matrices las transformaciones siguientes: 

l. La multiplicación de una de las filas por un número de K 
diferente de cero. 

IL La adición a una de las filas de la matriz de otra fila mul- 
tiplicada por un polinomio arbitrario f (à). 
— ir Suponemos en todo momento que las matrices consideradas son cuadrados, 


aunque muchos de jos resultados pueden ser extendidos directamente al caso de 
-matrices rectangulares. 
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111. La multiplicación de una de las columnas por un número de 
K diferente de cero. 

1V. La adición a una de las columnas de los elementos de otra 
«olumna multiplicados por un polinomio arbitrario f (h). 

Estas transformaciones se llaman fransformaciones elementales de 
«matrices. Si con una A-matriz se realiza una transiormación elc- 
miental se obtiene de nuevo una A-matriz; con esta matriz se puede 
reulizar otra transformación elemental, etc. Se dice que una A-ma- 
triz F es equivalente a una A-matriz G, si F se puede obtener de G 
mediante una cadena de transformaciones elementales. En muchas 
ocasiones resulta útil el lema siguiente: 

Mediante las transformaciones elementales 1 y 11 se pueden cam- 
biar entre sí dos filas cualesquiera de una A-matriz y mediante las 
iransormaciones elementales 111 y YV se pueden cambiar entre si dos 
columnas cualesquiera de la misma. 

En efecto, supongamos que es necesario cambiar entre sí la 
i-ósima y la j-ésima columnas de una matriz. Es fácil ver que esto 
se consigue realizando las siguientes transformaciones elementales: 
1) agregamos a la iésima fila la j¡-ésima; 2) a la pésima fila de 
la matriz nueva agregamos su ¿-ésima fila multiplicada por —l; 
3) multiplicamos la j-ésima fila de la matriz obtenida por —1 y 
4) agregamos a la ¡-ésima fila de la última matriz su /-ésima fila 
multiplicada por —1. Si realizamos transiormaciones análogas con 
las columnas, lograremos cambiar de posición la i-ésima y la /-ésima 
columnas. Hemos demostrado el lema. 

De este lema se deduce que si la matriz F difiere de G en el 
orden de las columnas o de las filas, la matriz F es equivalente a G. 

De la definición de equivalen: de A-matrices se desprenden 
directamente las propiedades siguientes: 

1. La relación de equivalencia es transitiva: si F es equivalente 
a G y G es equivalente a H, resulta que F es equivalente a H. 

En efecto, G se puede obtener, por hipótesis, de H y F de G 
mediante una cadena de transformaciones elementales; por consi- 
guiente, F se puede obtener mediante una cadena de transformacio» 
nes elementales de H. 

2. La relación de equivalencia es simétrica: si F es equivalente 
a G, G es equivalente a F. En otras palabras, si F se puede obte- 
ner de G mediante una cadena de transformaciones elementales, 
también G se puede obtener de F mediante una cadena de trans- 
forinaciones elementales. 

Demostremos primero que sí F se puede obtener de G mediante 
una transformación elemental, también G se puede obtener de F 
mediante una transformación elemental. Consideremos para ello, uno 
a uno, los cuatro tipos de las transformaciones elementales. Supon- 
gamos que F se obtiene de G mediante la transformación de tipo 1, 
es decir, multiplicando una fila ima de G por un número a320, 
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Entonces, multiplicando la ¡-ésima fila de F por a”*, obtendremos, 
evidentemente, G. Supongamos ahora que F se obtiene de G me: 
diante una transformación de tipo Il, por ejemplo, agregando a la 
i-ésima fila de la matriz G su j-ćsima fila multiplicada por f (à). 
En este caso, agregando a la i-ésima fila de la matriz F su /-ésima 
fila rmultiplicada por —f (2), obtendremos de nuevo G. Lo mismo 
se puede decir acerca de las transformaciones de tipo 111 y IV. 
Vemos, por consiguiente, que para toda transformación elemental 
existe la transformación elemental inversa que anula el resultado 
de la primera. Por esto, si la matriz F se obtiene de G mediante 
una cadena de transformaciones elementales, resulta que realizando 
las transformaciones inversas en el orden contrario podremos obte- 
ner de la matriz F la matriz G que es lo que se queria demostrar. 

3. La relación de equivalencia es reflexiva: toda matriz es equi- 
valente a sí misma. 

Por ejemplo, realizando con F dos transformaciones reciproca- 
mente inversas, obtendremos de nuevo F. 


13,2. Forma diagonal. Acabamos de demostrar que la relación 
de equivalencia es transitiva, simétrica y reflexiva. De aquí se 
deduce que las A-matrices se descomponen en clases de matrices 
equivalentes. Surge el problema: ¿puede indicarse una forma para 
las A-matrices tal que en cada una de estas clases haya una matriz 
de la forma dada, y sólo una? Las formas con esta propiedad se 
denominan canónicas. Demostraremos que para las A+matrices la 
forma diagonal, con algunas condiciones complementarias de divisi- 
bilidad, es canónica en este sentido. 

DEFINICION. Una A-matriz de tipo 


FRA al 
hA 


hJ 
se llama canónica diagonal, si todo elemento diagonal f; (à) divide al 
elemento siguiente fip, p y si el coeficiente principal de todos los 
polinomios f, (A), ..., Ía(A) diferentes de cero es 1. 

De aquí se deduce que si entre los elementos diagonales de una 
matriz canónica diagonal aparecen ceros, estos elementos deben 
ocupar las posiciones últimas, ya que el cero no puede dividir a 
ningún polinomio no nulo. Por otro lado, si entre los elementos 
diagonales figuran números diferentes de cero, éstos deben ser igua- 
les a 1 y deben ocupar las posiciones primeras, ya que 1 no es 
divisible por ningún polinomio con coeficiente principal 1, a excep- 
ción del polinomio 1. Por consiguiente, en el caso más general la 
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matriz canónica diagonal es de la forma 
1 e] 


1 
AA) 


donde f, (A), ..., Fa (à) no son constantes, sus coeficientes principales 
son iguales a 1 ycada uno de ellos es divisor del siguiente, 
TEOREMA I. Toda A-matriz puede ser reducida mediante un número 

finito de tranformaciones elementales a la forma canónica diagonal. 
* pemosTración, Sea G una A-matriz dada. Si G=0, nada hay 
que demostrar, puesto que O es ya de la forma normal. Suponga- 
mos por lo tanto que G40. Escojamos entre todas las A-matrices 
equivalentes a G aquella cuyo elemento del ángulo superior izquierdo 
sea diferente de cero y sea del grado minimo. Sea 


fu 0)... Ea] 


fm (A) +++ Fan (2) 
esta matriz. Demostremos que f,,(A) divide a todos los elementos 
de la primera fila y a todos los elementos de la primera columna 
de la matriz F. En efecto, sea 

heh 0a0Y+era) (i=1, 2... n), 0) 
donde 200) y rà) son el cociente y el resto de la división de 
fu 0) por fa (à). Realicemos con F la siguiente transiormación ele- 
mental: restemos de los elementos de la ¿-ésima columna los ele- 
mentos de la primera multiplicados por q,(2). La igualdad (I) 
muestra que el elemento de la primera fila y de la ¿-ésima columna 
de la matriz nueva resultará igual a r,(%). Si r,(A)%0, el grado 
de r,(A) es inferior al grado del divisor f,, (2). Cambiando entre sí 
la primera y la ¡-ésima columnas, obtendremos una matriz equiva- 
lente a-F en cuyo ángulo superior izquierdo figura un polinomio 
r,(0) de grado menor que el de f, (à); pero esto contradice a la 
definición de la matriz E Por consiguiente, r¿(A)=0. 

Indicando ahora por q;(à) el cociente de la división de f,¿(2) 
por f, (A). realicemos con la matriz F las siguientes transformacio- 
nes elementales: de la segunda columna restemos la primera mut- 
tiplicada por q,(2), restemos después de ¡a tercera columna la pri- 
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mera multiplicada por g,(A), ete. Realicemos a continuación 
transformaciones análogas con las filas. La matriz F resultará 
sustituida por la matriz equivalente 


O a TII ma 
ES a 
Hajo T Mi a 
O e RN 
donde A; (à) son unos polinomios determinados, 

Todos los polinomios h,,(A) son divisibles por fu (A). Efectiva- 
mente, si faQ) no divide a uno de ellos, digamos a h,(A), 
entonces sumando a la primera fila de la matriz H su ¿-ésima fila 
obtendremos una matriz Q con las siguientes propiedades: 

1) Q es equivalente a G, 

2) el elemento por de la izquierda de la matriz Q es dife- 
rente de cero y es del menor grado, 

3) en la primera fila” de la matriz Q figura el elemento hy) 
que no es divisible por el primer elemento de esta fila. 

Sin embargo, hemos visto que de las dos propiedades primeras 
se desprende que todos los elementos de la primera fila son divi- 
sibles por su primer elemento. Por consiguiente, la tercera propie- 
dad contradice a las dos primeras y nuestra proposición queda de- 
mostrada. Hemos probado, pues, que para toda A-matriz G existe 
una matriz equivalente H 'de tipo (2), donde todos los h; (à) son 
divisibles por fa (À). Realicemos ahora transformaciones elementales 

ri; 


con la matriz 
ha (0) +0 Min 0) 
H= a n 


hna 0) ++. Aan (À). 

Toda transformación elemental de H, puede ser considerada también 
como una transformación elemental' de la matriz H. Es fácil ver 
que la primera fila y la primera columna de la matriz H no varian 
en estas transformaciones. Además, puesto que todos los elementos 
de la matriz H, son divisibles por f, (à), todos los elementos de 
las matrices nuevas, que surgen de H, como resultado de transfor- 
maciones elementales, también serán divisibles por fı, (à). 

Aplicando a la matriz H, el resultado demostrado anteriormente, 
veremos que H, puede ser reducida mediante transformaciones ele: 
mentales a la forma 


' 


E 
O haf) 0 0) 


Ó Aa) ceo Pa) 
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y, por consiguiente, la matriz Ha la forma 


Fha A) 3 
Ba 0) 
has (À) -n Ban (A) 


Bra (0) + Bn 0) 


donde todos los h;,(2) (£, ¿=3, ..., n) son divisibles por fi, (A) 
y Has (À) es divisible por fı, (à). Continuando este proceso obtendre- 
mos al cabo de un número finito de pasos la forma canónica dia- 
gonal requerida. 

De nuestra demostración se puede extraer fácilmente un método 
práctico de reducción de A-matrices a la forma canónica diagonal. 
Su idea consiste en disminuir primero, empleando las transforma- 
ciones elementales, el grado del elemento que figura en la primera 
fila y en la primera columna y e. convertir en cero los demás 
elementos de las mismas. Después je haber lograda este primer 
objetivo, aplicamos el mismo método al ángulo H, que queda, etc. 

El teorema 1 afirma que toda clase de matrices equivalentes con- 
tiene al menos una matriz de forma canónica diagonal. En el punto 
siguiente quedará demostrado que esta matriz es única en cada clase. 


13.3. Máximos comunes divisores de menores. Sea F una %-ma- 
triz de orden n. Consideremos todos sus menores de orden k 
(k=1, 2, ..., n). Estos menores son unos polinomios en A. Indi- 
quemos por D, (À) su máximo común divisor", Si resulta que todos 
los menores de un orden k son iguales a cero, aceptaremos por 
definición que D¿(4)=0. En particular, D, (À) es el máximo común 
divisor de los elementos de la matriz F, mientras que D,(2) es 
igual al determinante de F, dividido por su coeficiente principal. 

TEOREMA 2 Las 2-matrices equivalentes tienen un mismo máximo 
común divisor de los menores de orden k (k=1,2, ..., n). 

Sean F, y F, dos A-matrices equivalentes. Indiquemos los máximos 
comunes divisores de sus menores de orden k por Dj, (2) y Dm Ô), 
respectivamente, Debemos probar que Dy (2) = Dy (À). Sabemos que 
F, puede ser obtenida de F, mediante una cadena de transforma- 
ciones elementales. Supongamos primero que esta cadena consta sólo 
de una transformación elemental. Por ejemplo, supongamos que F, 
se obtiene de F, multiplicando todos los elementos de la i-ésima 
fila de la matriz F, por un número «>+0. En este caso los menores 
respectivos de F, y de F, o bien son idénticos o bien difieren en el 


1 Convendremos en que el máximo común divisor es siempre el común 
divisor del grado mayor de coeficiente principal igual a 1. Por ello, todos los 
polinomios De (A) diferentes de cero son de coeficiente principal igual a 1. 
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factor constante a. Pero un factor constante no influye en el cálculo 
del máximo común divisor, de modo que D,,=D4,. Lo mismo su- 
cederá en el caso en que F, se obtenga de Ê, multiplicando por « 
los elementos de una de las columnas de la matriz F,. Supongamos 
ahora que F, se obtiene de F, mediante las transformaciones de tipo 
Il o IV; por ejemplo, aceptemos que F, se obtiene al agregar a la 
iésima fila de la matriz F, los elementos de la ¡-ésima fila multi- 
plicados por f (à). Demostremos que Dz, es divisible por Dp. 

En efecto, existen tres clases de menores de orden k de las ma- 
trices F, y F, A la primera pertenecen aquellos que no contienen 
elementos de ia ¿-ésima fila, En este caso los menores respectivos 
de las matrices F, y F, son, obviamente, iguales. A la segunda clase 
pertenecen aquellos menores que contienen elementos de la ¡-ésima 
Y de la j-ésima filas. Estos menores de las matrices F, y F, tame 

ién serán iguales, Ek que el valor de un determinante no se altera 
si a los elementos de una de sus filas se suman cantidades propor- 
cionales a los elementos de otra de sus filas. Finalmente, a la tercera 
clase pertenecen los menores que contienen elementos de la ¿-ésima 
fila y no contienen elementos de la ¡-ésima fila. Los menores res- 
pectivos de esta clase son de forma 


moli 


, M= 


tvy 


donde las filas de ambos menores que no han sido escritas coinciden, 
En virtud del teorema de adición de determinantes, tenemos 


- fin 


¿[M +1 09M, 


+10) | 


donde N, es un menor de la matriz F,. Todos los menores de orden k 
de la matriz F, son divisibles por Dm. De nuestros razonamientos 
se ve que Dm divide a todos los menores de orden * de la matriz 
F,, ya que éstos o bien coinciden con los menores respectivos de la 
matriz F, o bien se expresan linealmente en términos de los mismos. 
Pero en lal caso, D», aparecerá como factor en el máximo común 
divisor de los menores de orden k de la matriz F,, es decir, será 
un factor en Dw. Por lo tanto, si F, se obtiene de F, mediante 
una sola transiormación elemental, resulta que Da, es divisible por 
Dn: Realizando con F, la transformación elemental inversa, obten- 
dremos F,. Por ello, Da, debe ser también divisible por Dz. Pero, 
si los coeficientes principales de dos polinomios coinciden y si estos 
polinomios son divisibles uno por otro, ellos deben coincidir. Es 
decir, Da =D. Por ahora hemos demostrado la igualdad de los 
máximos comunes divisores suponiendo que F, se obtiene de F, 
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mediante una sola transformación elemental. Sin embargo, si D, (A) no 
varía en cualquier transformación elemental concreta, es obvio que 
D, (À) tampoco varia en el caso de varias transformaciones sucesivas. 
Por lo tanto, podemos considerar que el teorema 2 ha quedado de- 
mostrado en su forma general. 


Calculemos los polinomios D,(A), ..., D,(A) de una matriz de 
forma canónica diagonal 
54,0) 
4,0) 
D= P 
da Ù) 


Para obtener un menor de orden k debemos suprimir n—k filas y 
n—k columnas de D. Si suprimimos en D la i-ésima fila, en su 
¿-ésima columna quedarán sólo ceros. Por ello, para obtener un me- 
nor diferente de cero, debemos suprimir en D todas las columnas 
cuyos números coinciden con los de las filas suprimidas. Es decir, 
los menores de orden k diferentes de cero deben ser de la forma 


dv À) 
dv (À) 


=4,,0) dv, A). «sdo. (5) 


40) 


El máximo común divisor de estos menores es D,(A). De las desi- 
gualdades 1 < v, <v,<...< vs <n se deduce que 1< v, 2< v, 
2... RS Vy Por lo tanto dy, (À) es divisible por d;(A), de modo que 
d, (h). de, (A) es divisible por d,(A)...d, (A). Vemos, por consi- 
guiente, que todos los menores de orden k de la matriz D son di- 
visibles por el menor 


4, (0) 
a =d, 0). . -dy A). (4) 
EAG] 


Si este menor es igual a cero, todos los menores de orden k de la 
matriz D también son iguales a cero. Por definición, tenemos en este 
caso D, (à)=0. Si el menor (4) es diferente de cero, los polinomios 
d, (à), --., dy (À) son diferentes de cero y sus coeficientes principales 
son iguales a 1. Pero entonces también el coeficiente principal del 
menor (4) es igual a 1. Puesto que (4) divide a todos los menores 
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(3), resulta que Ds (à) coincide con (4). En ambos casos tenemos, 
por consiguiente, 


D, (a) =d, (1)d,0)-..d,0) (£=1,2, .... n). (5) 
Así se calculan los polinomios D(A) de una matriz canónica dia- 
gonal de elementos diagonales d, (2), ..., d,(2). 


Consideremos ahora una A-matriz arbitraria F. Indiquemos por 
D,(%) el máximo común divisor de los menores de orden k de esta 
matriz. Según el teorema 1, la matriz F puede ser reducida mediante 
transformaciones elementales a la forma canónica diagonal 


¡dy 
D= ae 
L dp 0) 


De acuerdo con el teorema 2 los polinomios D, (A) calculados para 
la matriz D coinciden con los respectivos polinomios D, (A) calcu- 
lados para F. Por consiguiente, los polinomios D,(A) de la matriz F 
y los elementos diagonales de la matriz canónica diagonal D, a la 
que se puede reducir F, están ligados por las relaciones (5). 


Supongamos que D, (à), ..., D, (à) son diferentes de cero y que 
los demás polinomios Da G) u22» D, (à), si es que existen, son 
iguales a cero. Entonces de (5) obtenemos 

D,(M=40M, 4,(4)=D, (A), 

D, (0) =4, (à) d, À), d, (à) =D, 0) :D À), 

D, (A) =d, (A)d, (A). - -d, A). a 0) =D, 0):D, Å) 
D,a, (à) =d, (à) da (à). . d, (094,4, 0), d,s (0) =D, 0) :D, (A). 
“Puesto que d,.,(2)=0, resulta que d,,, (à), ..., da (à) también 


deben ser iguales a cero y obtenemos definitivamente 


4,1) =D, (0), dp A=, ADA) -s d 0)=D, À): D,- (4), 
den M=. =d, 0)=0. (6) 


De esta forma hemos obtenido el teorema siguiente. 

TEOREMA 3. Sí los máximos comunes divisores D,(A) de los meno- 
res de orden k de una hematriz F son diferentes de cero para k=1, 
2, ..., r y sí D,,,(4)=0, los elementos diagonales da (à) de la matriz 
canónica diagonal, a la que se reduce F mediante transformaciones 
elementales, se expresan en términos de D,(%) por las fórmulas (6) 
y. por consiguiente, la matriz F los define univocamente. 

Los polinomios d (à), ..., da (A) se llaman factores invariantes 
de la matriz F. 


11843 
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El número 7 que figura en las igualdades (6) tiene un sentido 
muy simple: es el rango de la matriz F. Efectivamente, el rango 
de la matriz F es el orden máximo de los menores de F diferentes 
de cero, Si este orden es igual a r, tenemos en consecuencia que 
D, (4) +0 y que D,.,(A)=0. Recíprocamente, las condiciones 
D, (à) 0 y D;,,(1)=0 significan que uno de los menores de orden r 
es diferente de cero y que todos los menores de orden r+1 son 
iguales a cero. Por consiguiente, el rango de F es igual a r. 


13.4. Condiciones de equivalencia. Empleando los resultados del 
punto anterior es fácil encontrar las condiciones que garanticen que 
dos A-matrices dadas sean equivalentes. Representaremos estas con- 
diciones en dos formas. 


PRIMERA CONDICIÓN DE EQUIVALENCIA, Para que unas matrices po- 
linomiales de orden n sean equivalentes es necesario y suficiente que 
los máximos comunes divisores de sus menores de orden k coincidan 
para k=l, 2, ..., n. 

Puesto que la coincidencia de los máximos comunes divisores de 
los menores equivale a la coincidencia de los factores invariantes 
respectivos, la primera condición de equivalencia puede ser enun- 
ciada del modo siguiente: para la equivalencia de -matrices es ne- 
cesario y suficiente que sus factores invariantes correspondientes sean 
iguales. 

La demostración es evidente. En efecto, si dos -matrices F y G 
son equivalentes, sus máximos comunes divisores D, (À) son idénticos 
(teorema 2). Viceversa, si los polinomios D,(A) de F y de G son 
Iguales, las matrices F y G se reducen mediante transformaciones 
elementales a una misma matriz canónica diagonal (teorema 3). Pero 
dos matrices equivalentes a una tercera son equivalentes; por con- 
siguiente F es equivalente a G que es lo que se queria demostrar. 


SEGUNDA CONDICIÒN DE EQUIVALENCIA. Para que unas matrices po- 
linomiales F y G de orden n sean equivalentes es necesario y sufi- 
ciente que satisfagan la relación 


G=PFQ, 


donde P y Q son unas matrices polinomiales de determinantes cons- 
tantes diferentes de cero®, 


» Hemos definido la equivalencia de A-matrices mediante las transforma» 
ciones elementales, Con frecuencia el concepto de equivalencia se define también 
de otra manera. Se dice que dos A-matrices G y F son equivalentes, si existen 
unas matrices cuadradas regulares P y Q de determinantes constantes que sa- 
tisfacen la relación G=PFQ. Entonces, la segunda condición de equivalencia 
puede ser interpretada como el teorema de equivalencia de estos conceptos. 
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Antes de pasar a la demostración de esta proposición hagamos 
algunas observaciones. Sea 


Fl r 
A= a i-ésima fila, 


¡e 1 


donde œ es un número diferente de cero. Multiplicando a la izquier- 
da por A una matriz cualquiera F, veremos que todos los ele- 
mentos de la matriz F permanecerán intactos, menos los elementos 
de la iésima fila que resultarán multiplicados por æ. Por consi» 
guiente, toda LANIO MEIR elemental de tipo 1 realizada con la 
matriz F equivale a la multiplicación de F a la izquierda por una 
matriz A convenientemente escogida. Análogamente, si multiplicamos 
la matriz F a la izquierda por la matriz 


Lo. 0... 0 ....0 


0... 1... f()... 0 | ¿ósima fila 
B=|: E 5 

o. 1 j-ésima fila, 

Were Ones De to 1 


donde todos los elementos diagonales son iguales a la unidad, el 
elemento de la ¿-ésima fila y de la ¡-ésima columna es igual a f (À) 
y los restantes elementos son iguales a cero, resultará que a los 
elementos de la ¡-ésima fila de F se sumarán los elementos de. su 
j-ésima fila multiplicados por f (À). Por consiguiente, toda transfor- 
mación elemental de tipo 11 equivale a la multiplicación a la izquierda 
de la matriz F por una matriz B convenientemente escogida. 

Finalmente, es fácil comprobar de esta misma forma que las 
transformaciones elementales de la matriz F de tipo MI y IV equi- 
valen a la multiplicación de F a la derecha por las matrices respec- 
tivas A y B. 

Pasemos ahora a demostrar ta segunda condición de equiva- 
lencia. ss 


ne 


164 Cap. IV. Matrices polinomiales 


NECESIDAD. Sea G una matriz equivalente a la matriz F. Esto 
significa que G se puede obtener de F mediante una cadena de trans- 
formaciones elementales sucesivas. Podemos sustituir cada una de las 
transformaciones elementales por la multiplicación por una matriz 
de tipo A o Bala izquierda o a la derecha, respectivamente. Como 
resultado obtendremos la igualadad 


G=PP,...P¿FQQs- Qu (m) 


donde cada una de las matrices P; y Q; es de tipo A o B (i, j=1, 
2, ...). Pongamos 


P=PP,...Py y Q= QQ.. -Qo 


Puesto que los determinantes de las matrices B son iguales a la 
unidad y los determinantes de las matrices A son números constantes 
diferentes de cero, resulta que los determinantes de las matrices P 
y Q también serán unos números constantes diferentes de cero. La 
relación (7) muestra que 


G=PFQ 


y la necesidad queda demostrada. 
SUFICIENCIA. Supongamos al contrario que 


G=PFQ, (8) 


donde P y Q son matrices polinomiales de determinantes constantes 
diferentes de cero, El máximo común divisor D,(A) de todos los 
menores de orden n de la matriz P es igual al determinante de P, 
dividido por su coeficiente principal. Puesto que este determinante 
es un número constante, resulta que D,(à)= 1. Para k=n tenemos 
de las relaciones (5) 

D,0)=4,0)4,00)...d0)=1, 
y de aqui resulta 

4(M=d0)=...=d40=1, 
tonde d, (2), ..., d, (à) son los factores invariantes de la matriz P. 
Pero los factores invariantes de la matriz unidad E también son 
todos iguales a la unidad, ya que E es de forma canónica diagonal. 
Según el primer criterio de equivalencia, de aquí se deduce que la 
matriz P es equivalente a EN por consiguiente, puede ser obtenida 
de E mediante una cadena de transformaciones elementales, Toda 
transformación elementa! puede ser sustituida por la multiplicación 
por una matriz de tipo A o B. Así P quedará representada en la 
forma siguiente 

PSP, vei PiE oi QP ar Pili +++ Qu 


donde P; y Q; son mátrices de tipo A y B. 
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Aplicando estos mismos razonamientos a la matriz Q, obtenemos 
un desarrollo análogo 
Q=M, -. MN, o Ny 
Introduciendo en (8) estas descomposiciones, llegamos a la igualdad 
G=P ... PQ, 0 QEM, .-. M,N, ON (9) 


de la cual se ve que G se obtiene multiplicando sucesivamente la 
matriz F por las matrices P,, Q, M, y N, de tipo A o B. Pero 
cada multiplicación de esta índole equivale a una transformación 
elemental. Por consiguiente, G es equivalente a F y hemos concluide 
la demostración. 


Ejemplos y problemas 


1. Redúzcanse a la forma canónica diagonal mediante transiormaciones 
elementales las matrices 


2 1 0 A+ Io o IA Mo A 
0 4-2 =t | 0. 4 ..0 [a 4 id. 
0. 0 4-2 o 0 a+ Ipa a 


2. Empleando los máximos comunes divisores de los menores, hállese la 
forma canónica diagonal de las A-matrices 


A10 o a+ B 1 0 
0,1 0 -B ar 0 l 
00A i y 0 0 a+ p 
543142 0.0 -B atà 


3. Demuéstrese que toda A-matriz rectangular de m filas y de n columnas 
puede ser reducida mediante transformaciones elementales a la forma 


aà 0 0 a 
0 dd) F de o a la forma 40 
o o 0 go 


¿Cómo debe enunciarse la segunda condición de equivalencia para estas matrices? 
4. Demuéstrese que mediante las transformaciones elementales de tipo 1 y 1 
toda A-matriz cuadrada puede ser reducida a la forma 
Paa A) har 0) ++ han AN 
la 0) aae fan) 


`a: 


donde tos elementos diagonales o bien son iguales a cero o bien son de coeficiente 
principat igual a 1. 

5. Consideremos en lugar de A-matrices las matrices formadas por numeros 
enteros. Las transformaciones elementales de estas matrices se definen del modo 
siguiente: I, multiplicación de una fila por «+ 1; Jl, adición a los elementos de 
upa fla de los cementos de otra cualquiera mulliplicados por un número entero, 
II y IV, transformaciones similares de las columnas. Una matriz diagonal 
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formada por números enteros se llama canónica, si sus elementos diagonales son 
no negativos y si todo elemento diagonal anterior divide al que le sigue. Demué- 
sirense los” Ìoremas: a) toda matriz formada por números enteres puede ser 
reducida, mediante un número finito de transformaciones elementales, a la forma 
Sanónica diagonal; b) esta forma canónica diagonal es única y c) pata la equi: 
valencia de dos matrices F y G formadas por números enteros es necesario y 
suficiente que para ellas sea válida la relación G=PFQ, donde P y Q son unas 
matrices formadas por números enteros, cuyos determinantes son iguales a +1. 
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Los factores invariantes determinan, salvo una equivalencia, la 
matriz polinomial F. Sin embargo, sí F se descompone en células 
diagonales, la relación entre los factores invariantes de la matriz F 
y los factores invariantes de las células resulta compleja. Por ello, 
conviene considerar en algunas cuestiones, en lugar de los factores 
invariantes, los así llamados divisores elementales de la matriz F, 
ya que el comportamiento de estos últimos en el caso de descom- 
posición de F es más sencillo. 


14.1. Relación con los factores invariantes. Consideremos una 
A-matriz arbitraria F, cuyos elementos son polinomios en A con 
coeficientes del campo principal K. No someteremos el cuerpo con- 
mutativo K a ninguna restricción. Sean d, (à), d, (à), +... dn (A) 
los factores invariantes de la matriz F. Parte de estos factores 
puede ser igual a cero; por ello, supondremos, para concretar, que 
d, (4), ..., d, (À) son diferentes de cero y que d,.., (ì)=. . . =d, (ì)=0. 
El número r, como hemos visto anteriormente, es el rango de la 
matriz F. Descompongamos cada uno de los polinomios d, (A), . . ., d,.(A) 
en factores irreducibles sobre el cuerpo conmutativo K. Sea, por 


ejemplo, 
di A) = (e, A)" [e (29)... [e,0))%, 


donde e, (A), ..., € (à) son distintos polinomios irreducibles de 
coeficiente principal igual a 1. Las expresiones [e, (4))%s, ...., [8,(2)]"u 
se llaman divisores elementales del factor invariante d; (A). Los divi- 
sores elementales de todos los factores invariantes de la matriz F 
que no sean constantes se llaman divisores elementales de esta matriz. 
Por ejemplo, si los factores invariantes de la matriz F son iguales, 
respectivamente a 1, 2, A? (4-41) y 22 (A-t 1)*, sus divisores elemen- 
tales serán A, 22, 22, 4+1, (441). Un divisor elemental de tipo 
[e ()]*, donde e(a) es un polinomio irreducible, se llama pertene- 
ciente al polinomio e(A). En el ejemplo considerado los divisores 
elementales A, à? y A? pertenecen a A, mientras que A2-+1 y (4-1) 
pertenecen a A- 1. 

Tomemos ahora una A-matriz F y escribamos todos sus divisores 
elementales. Si uno de los divisores elementales de F figura en 
varios factores invariantes de F, lo escribiremos tantas veces cuantas 
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aparece en los factores invariantes. Demostremos que el sistema de 
divisores elementales obtenido de esta forma determina plenamente 
todos los factores invariantes de la matriz F diferentes de una 
constante; si tomamos en consideración, además, el orden y el 
rango de F, petarda determinados todos los factores invariantes 
de la matriz F. 

TEOREMA 1. El orden, el rango y el sistema de divisores “elemen- 
tales de una A-matriz F determinan plenamente sus factores inva- 
riantes y, por consiguiente, determinan F salvo una equivalencia. 

La demostración se aclara fácilmente con el ejemplo siguiente. 
Supongamos que F es de orden 6 y de rango 4 y que sus divisores 
elementales son A, 4%, 4%, A+-1, (A4-1)%, A—1 y A—1. Puesto que 
el orden de F es 6, la matriz F tiene seis factores invariantes 
d, (ù). Además, d,(4)=d,(4)=0, ya que el rango de F 

. Si descomponemos d, (A), .--, d, (à) en factores debemos 
obtener los siete divisores elementales indicados. Puesto que, sin 
embargo, d, (À) es divisible por d,(A), d, (à) y d, (À), resulta que en 
d, (2) figuran los divisores elementales de potencia superior pertene- 
cientes a todos los polinomios irreducibles. Luego, d, (à) =M (A+ 
+1) (4—1). Entre los divisores elementales restantes 2, At, 2 4-1 
y A—1 los de potencia superior deben componer d,(A); por consi- 

uiente, d, (À) =A? (44 1)(4—1). A su vez, los de potencia supe- 

rior de éntre los que geom deben formar d, (À), es decir, d, (À) =A. 
Puesto que todos los divisores elementales han sido ya distribuidos, 
resulta que d,(4)=1. Es obvio que este método se puede aplicar 
en cualquier caso, lo que demuestra el teorema. 

Los divisores elementales dependen del campo principal K. Por 
ejemplo, supongamos que los factores invariantes de una A-matriz F 
son iguales a A41 y (2-41). Si el campo principal es cuerpo de 
los números reales, el polinomio /*-+-1 es irreducible y los divisores 
elementales de la matriz F son 1*+1 y (2241)%, Sin embargo, si 
el campo principal es cuerpo de los números complejos, se tiene 
Me 1=(A—i) (A+ i) y los divisores elementales de F serári A-+1, 
MA? Ai y ADA 

14.2. Divisores elementales de una matriz descompuesta. Para 
obtener los divisores elementales de una A-matriz que tiene la forma 
canónica diagonal es suficiente tomar, de acuerdo con la definición, 
todos los divisores elementales de sus elementos diagonales. Mostre- 
mos que esta misma regla tiene lugar también para una A-matriz 
diagonal cualquiera. 

Lema. El sistema de divisores elementales de una A-matriz diago- 
nal cualquiera F es la unión de los divisores elementales de sus 
elementos diagonales. 

Supongamos que los elementos diagonales de F son los polino- 
mios f, (à), fa(A), «=., fa). Podemos aceptar, sin perder genera- 
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lidad, que todos estos polinomios son diferentes de cero y que sus 
coeficientes principales son iguales a 1. Indiquemos por D,(A) el 
máximo común divisor de los menores de orden k de la matriz F. 
Puesto que los coeficientes principales de los polinomios f, (2), ... 
++.» Fy(A) son iguales a la unidad, resulta que D,(.) es el deter- 
minante de la matriz F, es decir, 


DEE En 0). 
D,(0)=4, (4,0) ..- d,(, 


donde d, (A), ..., d, (A) son los factores invariantes de la matriz F. 
Por esto, indicando por e, (à), e, (â), »-., €,(2) los distintos factores 
irreducibles de los polinomios J,(4), ..., f.(A), podemos ver que 
todo divisor elemental de la matriz F es una potencia de uno de 
los polinomios e, (2), ..., €, (à). Despejemos ahora en f, (2), +. +» fh (A) 
las potencias máximas de e,(2) por las que son divisibles estos 
polinomios. Sea 


L0M=[(0)*2,/0) (=1,2, ....1), 


donde g/(A) no es divisible por e,(%). Queremos probar que 
[e, (AJ, =+., [8, (4)]%= es precisamente el sistema de divisores ele- 
mentales de la matriz F pertenecientes al polinomio irreducible e, (A). 
Puesto que los divisores elementales de la matriz F no dependen 
del orden de sus filas y de sus columnas, podemos disponer estas 
lilas y columnas de modo que 


aLa e ÚS (1 

Hallemos la potencia superior con la que e, (à) figura en D À). 
Por definición, D, (A) es el máximo común divisor de los menores 
de orden k de la matriz F, entre los cuales, como hemos visto 


anteriormente (p. 13.3), serán diferentes de cero sólo los menores 
iguales a 


BN o fa A= [e Ag O) +. or O). 


En vista de las desigualdades (1), la menor potencia de e, (A) la 
tiene el menor 


RO Lx 0) = [e ette A) --- gn A). 


Por consiguiente, D, (i) contiene e (A) en la potencia s+... Ese 
Sustituyendo aquí k por £—1, obtenemos que D,-, (A) contiene 
e,(2) en la potencia s,+ ... +S, Pero el factor invariante d, (À) 
es igual al cociente de D, (A) por D,_,(A). Por esto d, (À) contiene 
e, (A) exactamente en la potencia sẹ. Luego, los divisores elemen- 
tales de la matriz F pertenecientes al polinomio irreducible e, (A) 
coinciden con los divisores elementales pertenecientes a e, (4) de los 


Pero 
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elementos diagonales de la matriz F. Puesto que nuestro razona- 
miento es válido también para los demás polinomios e, (2), ..., e, (4). 
el lema queda demostrado en el caso más general. 

TEOREMA 2. El sistema de divisores elementales de una matriz 
descompuesta es igual a la unión de los sistemas de divisores elemen- 
tales de sus células. 

Sea F una A-matriz de forma celular diagonal 


¡Fs 


Las transformaciones elementales de cada una de las células 
Fx, ++.) F pueden ser consideradas como transiormaciones de toda 
la matriz F. Estas transformaciones no alteran la estructura celular 
diagonal de la matriz F y las transformaciones, realizadas con una 
de las células, no alteran la forma de las restantes. Por esto, 
mediante transformaciones elementales de la matriz F se pueden 
reducir todas las células a la forma diagonal. Aplicando el lem: 
vemos que los divisores elementales de las matrices F, F,, Fa 
serán las uniones de los divisores elementales de aquellos elementos 
diagonales que figuran en estas matrices. En particular, los divi- 
sores elementales de la matriz F se obtienen uniendo los divisores 
elementales de todos Jos elementos diagonales, es decir, uniendo los 
divisores elementales de todas las células F,, ..., Fm que es lo 
que se quería demostrar. 


Ejemplos y problemas 
1. Hállense los divisores elementales de las matrices siguientes: 


21 0.0. 1 42 o o ES 
2 0 1 A42 y 0.0 45 
kP 1 442 o Ai 

A A+ 2 AA 
2. Hállense los factores invariantes de las matrices: 

AA+) 4123 4100 

ae A12| (0210 

a+? > 21 orao’ 
201 à 001A 


3. Hállense los divisores elementales de la matriz. 
1942 At At 
3 441.3 
41024 10941 


en el cuerpo de los números racionales, en el cuerpo de los números reales y er, 
el cuerpo de los números complejos. 
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$ 15. Formas normales de la matriz de una aplicación 
lineal 


15.1. División de A-matrices. Se lama polinomio matricial en 
la variable A la expresión de tipo 


FM) = AATA AT AAA Ags (1 


A, son matrices cuadradas de un mismo orden y 
'de in campo principal K. Dos polinomios se llaman. 
iguales, si son iguales las matrices que guran. en estos polinomios 
en los términos con la misma potencia de la variable A. Los }-poli- 
nomios matriciales se suman y se multiplican siguiendo las reglas 
habituales, Está claro que todo A-polinomio puede ser representado 
mediante una matriz, cuyos términos son polinomios corrientes en A, 
y viceversa. Por ejemplo 

12 5 6 1071 _[4+54+1 6) +2] 
3-1 2)++[o J> -[ T. aTe: 

Luego, los A-polinomios matriciales son simplemente una forma 
especial de representación de A-matrices. 

Si la matriz A, de un A-polinomio (1) es diferente de la nula, 
se dice que m es el grado del polinomio matricial. El polinomio 
F (0) se llama regular, si la matriz A, es invertible. 

És evidente que el grado de una suma de h-polinomios matricia- 
des no sobrepasa el máximo de los grados de los sumandos. Mediante 
ejemplos es fácil comprobar que el grado del producto de dos A-poli- 
nomios matriciales puede resultar menor que la suma de los grados 
de los factores. Sin embargo, si al menos uno de los dos polinomios 
que se multiplican es regular, el grado del producto es igual exac- 
tamente a la suma de los grados de los factores. 

En efecto, si 


AM= AH AJO. Amo o 
B()=BJ4+BA 4 ... +B, 


y si B, es invertible, el término principal del producto A (A): B (A) 
es igual a A,B,A“*? y de AB,=0 resulta que O= A,BoBo™! = An 
lo que contradice a lo supuesto. 

TEOREMA 1. Cualesquiera que sean un ?-polinomio matricial A (A) 
y un h-polinomio regular B (a) existen unos A-polinomios P (À), S (A), 
QA) y RA) TA satisfacen las condiciones 

a) AQY=B0M)P0)+S(0) y AQ)=0Q0)B(0)+R A); 

b) o bien SÀ) =0 o bien el grado de $ (à) es menor que el grado 
de B(A); o bien R(A)=0 o bien el grado de R{à) es menor que el 
grado de B (À). 
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Los polinomios indicados se determinan univocamente por las con- 
diciones a) y b) y se dice que P(A) y S(A) son el cociente y el resto 
a la izquierda y que Q) y R() son el cociente y el resto a la 
derecha de la división de A (à) por B(2). 

La demostración consistirá en que indícaremos un método que 
permite encontrar los cocientes y los restos y que, en el caso con- 
siderado, coincide con el algoritmo de división de los polinomios 
corrientes. Supongamos, por ejemplo, que A (à) y B (A) son de forma (2). 
Si es m< p, podemos tomar P(A)=0 y S(1)=A(2). Sea, pues, 
mæ p. Formamos las siguientes diferencias sucesivas 


S, (A) = A (A)— AoBz'A" -PB (A) = CPAM 4 
S, A) = S, A)— C PBA -PB (h) == CHA p n 


Sn M= S, 0) CP BM (0) Cm. 
donde los puntos suspensivos representan términos de grados inferiores 
y donde m;,, < p. Sumando estas igualdades y tomando 

SA) = Si À), 

P0)= ABC COB e 4 CPB AM- P, 


obtenemos la primera de las relaciones a). Análogamente se deter- 
minan Q (A) y R(}). 
Resta demostrar la unicidad. Pero, si 


A0)=80)P0)+80)=B0)P,()+S,(0), 


se tiene 
BA [P 0)—=P,0)1=8S.(—S (A. 


Puesto que el polinomio B(A) es regular, resulta que si la dife- 
rencia P (A) —P, (à) es no nula, el grado del primer miembro es no 
menor que el grado de B(A), mientras que el grado del segundo 
miembro es, indudablemente, menor que el grado de B(A), Por esto 
debe ser P(A)=P, (A) y SO)=S,(M). 


15.2. Equivalencia escalar. Según el p. 13.4, dos A-matrices 
AQ) y "B() son equivalentes si, y sólo si, existen unas A-matrices 
U(A) y V(a), de determinantes no nulos que no dependen de A, 
que satisfacen la relación 

$ A) = UA) BAV A). (3) 


Diremos que la matriz A (à) es escalarmente equivalente a la matriz 
BQ), si existen unas matrices regulares U y V, formadas por ele- 
mentos que no dependen de ), que satisfacen la relación (3). Las 
matrices formadas por elementos que no dependen de 2 se llamarán 
escalares. 
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TEOREMA 2. Si dos A-polinomios de primer grado A+B y Ch+ D 

son regulares y equivalentes, también son escalarmente equivalentes. 
Por hipótesis tenemos 

A+ B =U (A) (Ch D)V 0), (4) 

donde U (A) y V(A) son matrices de determinantes constantes dife- 

rentes de cero. Indiquemos por P y S el cociente y el resto a la 

izquierda de la división de U (A) por Aà- B e indiquemos por Q y R 

q cociente y el resto a la derecha de la división de V (A) por A+ B. 

's decir, 

U=(A+B)P+S y V=Q(AL+8)4+R. (5) 

Las matrices S y R son escalares, ya que son de grado menor que 
la unidad. Probemos que 

Ar+B=S(CA+D)R. (6) 

Efectivamente, multiplicando por U~! ambos miembros de la igual- 

dad (4), sustituyendo Y por su expresión (5) y agrupando los tér- 

minos, obtenemos 


[U7*—(CA+D)Q] (Aà + B) = (Cà + D) R. 
Comparando tos grados del primero y del segundo miembros veremos 


que la expresión que figura entre los corchetes debe ser igual a una 
matriz escalar 7; tenemos, pues, que 


T=U-""—(CA+D)Q y T(Añ+B)=(Ch+D)R. 7) 
De aquí resulta que 

E=U(CA+D)Q+UT =(41+B)V-Q+UT= 

=> (A4 B)V-1Q+[(44 4 B)P+S]T, 
E=(A+B)[V-"Q+PT]+ST. 
Pero el segundo miembro puede ser de grado nulo sólo en el caso 
en que sea cero la expresión que figura entre los corchetes, de donde 
E=ST y T=S"2. 


es decir, 


Comparando con (7), obtenemos (6), donde S y, por consiguiente, 
R son matrices escalares invertibles, 


15.3. Criterio de semejanza de matrices. Según el p. 3.1, dos 


matrices A y B sobre un cuerpo conmutativo K se llaman semejantes 
si existe una matriz invertible T, formada por elementos de K, tal que 


A=T=UBT. (8) 


En el capítulo III se ha explicado la importancia que tiene el en- 
contrar las condiciones de semejanza de unas matrices dadas. Em- 
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pleando tos resultados obtenidos es fácil indicar las condiciones 

necesarias y suficientes de semejanza de matrices y resolver, con 

elio, uno de los problemas principales de la teoría de matrices. 
TEOREMA 3. Para que las matrices A y B, definidas sobre un cuerpo 

conmutativo arbitrario K, sean semejantes es necesario y suficiente 

que sus matrices caracteristicas AE—A y ¿E—B sean equivalentes. 
La necesidad es evidente, ya que de (8) se deduce que 


AE—A=T-(.E—B)T, 


es decir, que 2E—B y AE—A son equivalentes y, es más, son 
escalarmente equivalentes, Viceversa, supongamos que las matrices 
AE—B y ¡AE—A son equivalentes. Puesto que representan /unos 
A-potinomios matriciales lares y de primer grado, resulta que 
estas matrices son, en virtud del teorema 2, escalarmente equivalen- 
tes, es decir, existen unas matrices S y R escalares y regulares 
tales que 
1E—A=SME—B)R. 


Comparando en esta igualdad los coeficientes de A y los términos 
independientes, obtenemos 


E=SR y A=SBR, 
de donde resulta 
A=R-BR (9) 


que es lo que se quería demostrar. 

De los teoremas demostrados se puede extraer el siguiente algo- 
ritmo para determinar la semejanza de las matrices A y B: forma- 
mos las matrices características AE—A y AE—B y, empleando el 
proceso descrito en el p. 13.2, las reducimos mediante transforma- 
ciones elementales a la forma canónica diagonal. Si estas formas 
coinciden, las matrices A y B son semejantes; si las formas son 
distintas, las matrices A y B no son semejantes. 

A veces, además de establecer el hecho mismo de semejanza, es 
necesario hallar también la matriz transiormadori T tal que 
B=T-1AT. Con este fin, para pequeños valores del orden n de las 
matrices consideradas, se toma T =|| f:l}, se escribe la igualdad 
matricial TB=AT en forma de n? igualdades entre los elementos 
de TB y AT y se consideran estas igualdades como ecuaciones li- 
neales homogéneas respecto a las n? incógnitas (,y(i, j= 1, 2, ..., n). 
Resolviendo este sistema, se determina T. 

El método expuesto resulta muy voluminoso para grandes valores 
de n y en este caso es prelerible seguir el camino indicado en la 
propia demostración del teorema 3. Ánte todo, conociendo las tran- 
sformaciones elementales que reducen las matrices AE—A y AE—B 
a la forma canónica diagonal y conociendo, por consiguiente, las 
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transformaciones elementales que reducen A£—A a AE—B, podemos 
encontrar, de acuerdo con el p. 13.4, unas A-matrices U (2) y V(A) 
tales que 

1E—A =U (MN) AE—B)V (4). 


Calculando el resto a la derecha R de la división de V (A) por AE —A, 
tendremos, según (9), A=R”!BR, es decir, R será una de las mat- 
rices transformadoras que buscamos. 

Notemos que para determinar R no es necesario realizar de hecho 
la división de V (2) por AE—A. En efecto, representando V (A) en la 


forma 
VAJ=VA AV At- Va 
y aplicando el esquema de división del p. 15.1, obtenemos 
REVIA +V, A*t Vo a0) 
Análogamente, representando el polinomio U (à) en la forma «iz- 
quierda» 
USNU +AU, q UL 


y realizando la división a la izquierda por 2£— A, obtenemos para 
el resto a la izquierda S la expresión 


S= AU +AU, +... Up ai) 


Estas fórmulas para los restos de la división de un A-polinomio 
matricial por el binomio AE— A son totalmente análogas a la fórmula 
de Bezout r=f(a) pes el resto de la división de un polinomio 
corriente f (à) por el binomio A—a. Por esto las fórmulas (10) y (11) 
a veces se denominan fórmulas matriciales de Bezout para los restos, 


15.4. Forma normal de Jordan. En el p. 12.2 hemos introducido 
unas matrices de forma especial que hemos llamado matrices de Jordan 
y hemos estudiado algunas propiedades de las aplicaciones lineales, 
cuyas matrices en un sistema de coordenadas adecuado tienen la 
forma de Jordan. Sin embargo, hemos dejado sin resolver el problema 
principal acerca de las condiciones en las que la matriz de una 
aplicación puede ser reducida a la forma de Jordan. Pero ahora 
tenemos ya todos los medios necesarios para resolver este problema. 

TEOREMA 4. Toda matriz cuadrada sobre el cuerpo de los números 
complejos, asi como sobre cualquier otro cuerpo conmutativo algebrai- 
camente cerrado, es semejante a una matriz de la forma de Jordan. 
Dos matrices de Jordan son semejantes si, y sólo si, están compuestas 
por las mismas células de Jordan y difieren una de la otra a lo sumo 
en la disposición de las células a lo largo de la d:1gonal principal. 

Anteponemos a la demostración del teorema dos 'emas que tienen 
también interés por sí solos. 
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Lema i. La matriz característica de una célula de Jordan tiene 
sólo un divisor elemental (.—p)", donde n es el orden de la célula y p 
es su valor propio. 

La matriz caracteristica de una célula de Jordan dada (véase 
el p. 12.2) es de la forma 


Mp 1 0.. 0 07 
a A E e 


Ç AP j 


Calculemos el máximo común divisor D, (À) de los menores de orden 
k de la matriz AE—A. Ante todo, tenemos 


D, (0) =/ME—A|=(A—p)". 
Después, D,,_,(2) es el máximo común divisor de todos los menores 


de orden 1—1. Pero entre los últimos figura el menor 
—1 0 0 
A—p 0 0 


0 0 =p 


que se obtiene al suprimir la primera columna y la última fila en 
la matriz AE— A. Puesto que este menor es igual a El, resulta 
que D,.,(0)=1. Indiquemos por d, (A), d, (4) los factores inva- 
riantes de la matriz AE—A. De las relaciones 


Da-i) =d (0)... da ml, 
D,(1)=4, (2) -.. e 0)=A—py" 


se desprende que d,(1)= ¿()=1 y que d,(1)=(A—p)". 
Por consiguiente, MEA “tiene A un divisor elemental y este 
divisor es igual a (ì—p)". 

LEMA 2 El sistema de divisores elementales de la matriz caracte- 
ristica de una matriz de Jordan se compone de los divisores elemen- 
tales de sus células de Jordan y determina univocamente, salvo el orden 
de secuencia de las células a lo largo de la diagonal principal, la 
forma de la matriz de Jordan. 

Una matriz de Jordan es, por definición, una matriz celular 
diagonal con células de Jordan a io largo de la diagonal principal. 
Por ello, la matriz caracteristica de una matriz de Jordan se des- 
compone en las matrices características de las células de Jordan 
aisladas. De aquí se deduce, en virtud del p. 14.2, que el sistema 
de divisores elementales de la matriz caracterí: de una matriz 
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de Jordan consta de los divisores elemantales de las matrices ca- 
racteristicas de cada una de las células de Jordan, habiendo un 
divisor por cada una de estas células. Luego, el sistema de divisores 
elementales de la matriz caracteri ica de una matriz de Jordan 
determina la forma de esta matriz univocamente, salvo el orden 
de secuencia de las células a lo largo de la diagonal principal. 

Las matrices ¡características de matrices semejantes son equiva- 
lentes y, por lo tanto, tienen los mismos sistemas de divisores ele- 
mentales. De aquí se deduce que las matrices semejantes de Jordan 
deben estar formadas por células iguales de Jordan y, para concluir 
la demostración del teorema 4, resta sólo saber cómo obtener a 
parir de toda matriz dada A la matriz de Jordan smm a ella, 

a (Ap), ..., (A—p,)" el conjunto completo de los divisores 
elementales de matriz caracteristica AE— A. Indiquemos por B 
la matriz celular diagonal, cuyas células diagonales son las células 
de Jordan con los divisores elementales señalados. Luego, la matriz 
AE—B tendrá los mismos divisores elementales que tiene AE — A 
Pero entonces, según el p. 14.1, las matrices AE— A y AE—B son 
equivalentes y de aquí se desprende, en virtud del p. 15.3, que la 
matriz A es semejante a la matriz de Jordan B. Hemos demostrado 
el teorema. 

Los razonamientos expuestos ofrecen también una respuesta a la 
pregunta de cómo hallar a partir de una matriz dada A su matriz 
semejante de Jordan. Para ello es suficiente formar la matriz ca- 
racterística AE — A, reducirla mediante transformaciones elementales 
a la forma canónica diagonal, descompones en factores los polinomios 
diagonales, hallar los divisores elementales y construir a partir de 
los mismos la matriz de Jordan. Sea, por ejemplo, 


3 1 —3 
A=|-7 —2 9j. 
—2 —] 4 


Formamos la matriz característica 
23 1 3 
AA=| 7 142 9 
2 "44 


determinamos sus factores invariantes. Es fácil ver que estos fac- 
lores son L i, QI) A2. Por consiguiente, los divisores elos 
mentales serán À—1 y (ì—2)* y la matriz de Jordan es 


100 
safo?! . 
002 
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Para terminar hagamos una observación más. Si los divisores 
elementales de la matriz 2£— A resultan de primer grado, las cé- 
lulas de Jordan de la matriz de Jordan correspondiente B serán de 
primer orden, es decir, la matriz B será diagonal. Recíprocamente, 
si la correspondiente matriz de Jordan es diagonal, los divisores 
elementales serán de primer grado. Por consiguiente, para que una 
matriz dada sea semejante a una diagonal es necesario y suficiente 
que todos los divisores elementales de su matriz característica sean de 
primer grado. 


16.5, Forma normal natural. En el cuerpo de los números complejos toda 
matriz es equivalente a una matriz de Jordan determinada. Si el campo prin- 
cipal K es un cuerpo conmutativo arbitrario, la reducción a la forma de Jordan 
puede resultar imposible. En todo caso, para que esta reducción sea posible es 
necesario, y como puede verse fácilmente también es suficiente, ques! polinomio 
característico de la matriz se descomponga sobre K en factores lineales. Es por 
esto que surge el problema de indicar una forma normal a la que puede ser 
reducida la matriz sobre el cuerpo conmutativo del que se toman sus elemen- 
tos. Existe una cantidad infinita de formas normales de esta índole, Entre éstas 
se obliene con mayor facilidad la forma normal llamada natural. 


Sea n 
[Wa ade py IA 
un polinomio cualquiera de grado no nulo y de coeficiente oa igual a la 


unidad. Aceptaremos que los coeficientes del polinomio f () pertenecen a un 
cuerpo conmutalivo K. La matriz 


o 1 o 
9.0.4 
Al 
o CO 
—% =a —% 


¡rado no nulo y de coeficiente princi- 
pal Y y si À es su matriz asociada, los tire invariantes de la matriz carac- 
FO), 


A —1 
0a 
AEAS| 
o o 
o 


3uprimiendo la primera columna y la última fila obtenemos un menor igual a 
Dre. Por consiguiente, el máximo común divisor D,_+ (1) de os menores 
de orden nol es igual a, la unidad, En cuento a Dy (i), este polinomio es 
igual al determinan! le la matriz AE—A. Desarrollando este determinante 
según los elementos de la última fila, encontraremos directamente que 
DaM =n AAA A, 
De D, (0) =1 se deduce que di ()=-..=d4-1 (M=I y de Da =f 0) se 
desprende que da (A) =F (A) que es Jo. que se quería demostrar. 
Se dice quela matriz Á es de forma normal nalural, Si A se descompone 
en células Ar, As «+.» A, que son las matrices asociadas de unos polinomios 


121843 
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aA), fa 0), --.. fs (à) cada uno de los cuales es divisible por el anterior. 
robemos que los factores invariantes de la matriz A son iguales a 1, ..., b, 
fa (0), fa), -... Fs Ó), donde el número de unidades es igual a la suma de 
los grados de los polinomios f, (A), ..., fs (à) disminuida en s. Efectivamente, 
la matriz característica es de la forma 
CAE, — A 
MEA, 


AE— A= 


EA, ) 


Según el lema, toda célula AE¡— A, puede ser reducida mediante transforma- 
ciones elementales a la forma diagonal en la que los elementos diagonales 
serán l, ».., l, f4(0). Cambiando después en la matriz AE—A el orden de 
las filas y de las columnas, la reduciremos a la forma diagonal con los ele- 
mentos diagonales 1, ..., 1 fa (à), .... Js (À). Puesto que todo elemento aquí 
es divisible por el anterior, ésta Será la forma canónica diagonal y los elemen- 
dos 1, ss., 1, fil) +.. fsld) serán los factores invariantes de la matriz 
A£—'A. Cómo quiera que el “orden de la matriz A era igual a la suma de 
los grados de los polinomios [1 (A), .... fs (A) y el número total de factores 
invariantes es igual al orden de la maíriz, resulta que el número de unidades 
que figuran entre los factores invariantes coincide con el señalado, 

De nuestro razonamiento se desprende, en particular, que la forma normal 
natural queda unívocamente determinada por los factores invarientes de su 
matriz característica, 

Ahora podemos demostrar en unas palabras el teorema siguiente, 

TEOREMA 6. Toda matriz A con elementos de un cuerpo conmulativo K se 
reduce sobre este cuerpo a una forma normal natural, y sólo una. 

Sean l, e Do f(A), -es f9(A) los factores invariantes de la matriz 
AE— A. Puesto que la suma de los grados de todos los factores invariantes 
debe ser igual al orden de la matriz A, resulta que el número de unidades que 
figuran aquí es igual a la suma de los grados de los polinomios fa (A), ..., fs(A) 
disminuida en s, Construyamos para cada uno de los polinomios de (A), su ma- 
tiz asociada B) y consideremos la, matriz celular diagonal de células diagonales 

in :==+ Be. Como todo polinomio f;(A) es divisible por el anterior, Ë es la 
matriz normal natural. Según hemos demostrado anteriormente, los factores 
invariantes de la matriz AE—B son iguales a l, ..0. 1, f O) sses fy) Y 
coinciden, por consiguiente, con los factores invariantes de la matriz A£—A. 
De aquí se deduce, en virtud del teorema 3, que A es semejante a B. Con esto 
queda demostrada la posibilidad de reducir la matriz A a la forma normal na- 
tural. La unicidad resulta de que la matriz natural B se determina unívoca: 
mente por los factores invariantes, que, a su vez, se determinan univocamente 
por la matriz A. 

16.6. Otras formas normales. La ventaja de ta forma normal natural estriba 
en que es absolutamente univoca: tanto las propias células diagonales como el 
orden en que están dispuestas a lo largo de la diagonal principal se determinan 
univocamente. Entre los defectos figura el que esta forma no ofrece la reduc- 
sión a las células de menor orden posible así como el que no comprende la 
forma de Jordan como un caso particular. 

El primero de estos defectos puede ser superado del modo siguiente. Con- 
vengamos en llamar una matriz 8 casinatural, si B se descompone en células 
By.» Bs que representan las matrices asociadas de polinomios de tipo 
(er Oy, tes ()I”*, donde e: (à), .... es (à) son polinomios irreducibles 
sobre el campo principai K de coeficientes principales iguales a 1. Puesto que 
8 es la matriz asociada del polinomio (e; (A)]”, los factores invariantes de la 
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matriz característica AE;— B; son iguales a 1, ..,, 1, [e,(4)J”, Por consiguien- 
te, AE;—B; tiene un único divisor elemental [e; (})}™} y los divisores elemen- 
tales de la matriz AE—B serán [e, (4)]", ..., [e,(4)]"%, Puesto que el rango 
de la matriz AE—B es igual a su orden y es igual a la suma de los grados de 
los polinomios (e; (A)]”%, resulta que la matriz casinatural se determina por sus 
divisores elementales univocamente, salvo el orden de disposición de las células 
a lo largo de la diagonal principal. 

Igual que en el punto anterior de aquí se desprende directamente que toda 
matriz A formada por elementos de un cuerpo conmutativo K se reduce sobre 
este cuerpo a la forma normal casinatural. Esta forma queda determinada por 
la matriz A univocamente, salvo el orden en el que siguen las cólulas a lo lar- 
0 de la diagonal principal. 

Las células de la forma casinatural no pueden ser descompuestas sobre el 
cuerpo conmutativo X en células de menor orden, ya que si esta descomposi- 
ción fuese posible, resultaría que la matriz caracierística de la célula tendría 
por lo menos dos divisores elementales en lugar de uno. 

Para concluir examinemos la forma normal que puede ser considerada como 
una generalización de la forma de Jordan al caso de subcuerpos conmutativos 
arbitrarios K del cuerpo de los números complejos !). Sea e(J) un polinomio 
irreducible con coeficientes de K. Aceptaremos que el polinomio e(A) es de 
grado no nulo y que su coeficiente principal es igual a la unidad. 

LEMA 4. Sí el polinomio característico de una matriz A formada por ele- 
mentos de un cuerpo conmutativo numérico K es irreducible sobre K y es Igual a 
€(A), la matriz celular 


donde E es la matriz unidad, tiene una matriz caracteristica que posee un único 
divisor glemental [e (A)I", donde m es el número de células diagonales de la 
matriz B. 

Sea AE— A= P; entonces 


(12) 


Si Stregamos ahora a tas células de una columna cualquiera de la matriz 
gi2 los células de otra cualquiera de sus columnas multiplicadas por una 
-matriz arbitraria S, esta operación equivaldrá, obviamente, a una serie de 
transformaciones elementales de tipo II o IV realizadas con la matriz AE— B, 
de modo que el resultado será una matriz equivalente a A£—B. Tengamos en 
cuenta esta observación y reaflcemos sucesivamente las siguientes transforma- 
ciones con la matriz A£—B: agreguemos a su primera columna la segunda 
columna multiplicada por P; agreguemos a la primera columna de la matriz 
nueva su tercera columna multiplicada por P*, a su segunda columna la tercera 
multiplicada por P, ete. Después de estas transformaciones obtendremos la 


1) Hablando más generalmente, al caso de cualesquiera cuerpos conmutati- 
vos perfectos. Pero entonces, en lugar del cuerpo de los números complejos 
habrá que tomar la adherencia algebraica del cuerpo conmutativo correspondiente. 


+ 
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o —E ý 
o 0 
ooi a 


Agregando ahora a la última fila la primera, la segunda, .., filas multiplica- 
das, respectivamente, por P™~1, Pm=z, ...'y cambiando el orden de las co- 
lumnas, obtendremos la matriz 


matriz 


" a3 


Puesto que la matriz (13) tiene la forma celular diagonal y sus células Iniciales 
coinciden, salvo el signo, con matrices unidades, resulta que los divisores ele- 
mentales de la matriz (13) coinciden con los divisores elementales de la matriz 
Pm (.£ — Aya que pasamos ahora a examinar. 

or hipótesis, el polinomio característico de la matriz A es igual a e(%) y 
es Irreducible sobre el cuerpo conmutativo K. De aquí se desprende que todas 
sus raíces en el cuerpo de los números complejos son diferentes y que, por con- 
siguiente, existe una matriz compleja T tal que TAT=1 es de forma diagonal 
y que 


Aa 
ió 
ME—TAT-'= $ 


p N 


La matriz P% es equivalente a la matriz TP=T-1=(TPT=1)m y la última es 
de la forma 


Aa)” 
ITQEA)T-J9=(AE=TAT-9= "A 
‘aana 


Por esto, los divisores elementales de la matriz P2 en el cuerpo de los núme- 
ros complejos son iguales a (A= an” (A—an)". Todos ellos pertenecen a 
diferentes polinomios irreducibles. Los laciores invariantes de la matriz Pa son 
s 2254 1, Qa). ..(— ay) = [e (A)]™. Pero el polinomio e (A) es irreducible 
sobre el cuerpo conmutativo K y, por consiguiente, la matriz. P7 tiene en 
este cuerpo conmutativo sólo un divisor elemental, a saber, [e(A)]%. Es decir, 
la, matriz (13) y con ella también la matriz (12) tienen sôlo un divisor elemen- 
tal fe (1)1%. Hemos demostrado el lema. 

Si A es la matriz asociada de e(A), diremos que la matriz B es la célula 
generalizada de Jordan. correspondiente al divisor elemental [e (4))». Asimismo 
diremos que una matriz tiene la forma generalizada de Jordan, si se descom- 
pone en células generalizadas de Jordan. Está claro que una matriz generali. 
zada de Jordan se determina plenamente por sus divisores elementales. 

TEOREMA 6. Toda matriz A formada por elementos de un cuerpo conmuta. 
tivo K se reduce sobre este cuerpo a la forma generalizada de Jordan. Está forma 
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queda determinada por la matriz A univocamente, salvo el orden de disposición de 
las células a lo largo de la diagonal principal. 

En electo, sean [e,(A)J%, ..., [2, (1) los divisores elementales de la ma- 
triz AE—A en el cuerpo conmutalivo K. Construyamos para todo polinomio 
le; (A)]™ la correspondiente célula generalizada de Jordan B; y consideremos la 
matriz celulas diagonal B con los células B, a lo targo dela diagonal prin- 
cipal. 

PoÈn virtud del lema 4, los divisores elementales de la matriz A£—8 son 
iguales a los respectivos divisores elementales de la matriz 2£—A. Puesto que 
AE—8 y AE—A son, además, del mismo rango y del mismo orden, resulta 
que A es semejante a B. La unicidad se deduce de que los divisores elementa- 
les de la matriz A£— A determinan univoramente la matriz B. 

Si el campo principal K es cuerpo de los números complejos, todos los 
polinomios irreducibles son del primer grado. Por consiguiente, las matrices 
A y B de las células generalizadas de Jordan serán del primer orden, de modo 
que las células generalizadas se convierten en las células corrientes de Jordan. 

Consideremos también el caso en que el campo principal K es el cuerpo de 
todos los números reales. Los polinomios irreducibles sobre K serán de dos tipos: 
1) polinomios de primer grado A—p; las respectivas células generalizadas de 
Jordan serán células corrientes de Jordan y 2) e(A)=A2-Fph+g, donde 
p%—4g < 0; la célula asociada A es de la forma 


[5 —+] w 


pia célula generalizada de Jordan correspondiente a (A%4-pA-+-9)% tiene lo 
forma de la matriz B del lema 4, donde en lugar de A se puede tomar una 


matriz de otro tipo 
ap E]: 


a y B son los cooficientes de la parte real y de la parte imaginaria, respectiva- 
mente, de la raíz compleja del polinomio A*-+- pq. Esta sustitución es posible, 
ya que el polínomio característico de la matriz 


Aa = 
ream[Mp* 78 
es igual a ARPA do. 


Ejemplos y problemas 


1. Determínese cuáles de las matrices 


e 42 130 5 2-1 
6j. |-3-24 = 5|. |7 4 —22], 
5 -3 -73 -i 21-5 


8-13 16 20 —89 —32 2 00 
+ jü -5 20 y [1 14 
20 —9 — 36. 


son semejantes, Hállense sus matrices de Jordan semejantes. 

2. Demuéstrese que el polinomio característico de una matriz A es igual al 
producto de todos los factores invariantes y que el polinomio minimo es igual 
al último de los factores invariantes de la matriz caractes AE—A. 
blend: Flállense los polinomios mínimos de las matrices indicadas enel pro- 

lema l, 
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4. Demuéstrese que sobre el cuerpo de los números complejos toda matriz 
cuadrada es semejante a una matriz diagonal si. y sólo si, su polinomio minimo 
no tiene raíces múltiples. 

5. Demuéstrese que las matrices reciprocamente transpuestas A y A” son 
siempre semejantes 

Si A es una matriz regular y B es una matriz cualquiera, la motriz AB 
es semejante a la matriz BÅ. ¿Serán semejantes AB y BA siendo arbitrarias 
las matrices A 

7. Hállense las formas normales de las matrices 


l =l 
—3 =] -3 
[ 2 9-=z|y |Z! 

5 2-6) AS 
sobre el cuerpo de los números racionales, sobre el cuerpo de los números reales 
y sobre el cuerpo de los números complejos. 

, Muéstrese que para obtener la forma normal sobre el cuerpo de los 
púmeros complejos se puede tomar en lugar de las células de Jordan células de 
tipo 


donde æ es un número fijo cualquiera diferente de cero. y 


9. CARACTERISTICA DE SEGRE Sea „f una aplicación lineal de un os- 
pacio vectorial complejo y sean py, ..-, Py distintos valores propios de esta 
aplicación, Indiquemos por Øi Oan v.ir 07 los órdenes de os cilulas 
de Jordan en la forma normal de Jordan de „4, correspondientes al valor 
propio pa. El símbolo 


MOi Gars +++) (013, Ozas 00.) <-> (Orgs 0259 a) 
se denomina caracteristica de Segre de la aplicación ul. Por ejemplo, las matrices 
Li 21 210 2100 
01 02 21 210 
bes 21)" ES 21 
2 02) 3 2 


tienen, respectivamente, las siguientes características de Segre: [(2,1) (1)), 
(6,2), IE) 00] y IA. Calcúlense las caracteristicas de Segre de las matrices 
indicadas eo el problema 1. 


10. CARACTERÍSTICA DE WEYR. Sea yf la misma aplicación del problema 

anterior. Indiquemos por 
A de -Hap 
los defectos de las aplicaciones A—=p¡8, (4— p8), tul —pi0)?, donde p 
es la multiplicidad del valor propio py. La fila (Aja, Aia, «.., Up) Se denomina 
caracteristica de Weyr de la aplicación A correspondiente al valor propio py. 
Demuéstrese que las características de Weyr de las aplicaciones indicadas en el 
problema 9 son iguales, respectivamente, a 
42, 1), (1), 142, 291 (LL 1) (1) y gi o, h 

11. Demuéstrese que la característica de Segre y la característica de Weyr 

correspondientes a un mismo valor propio están relacionadas del modo siguiente. 
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Supongamos que la característica de Segre es (6, 4, 3, 3). Consideremos el dia- 
grama de puntos 


El número de puntos en las sucesivas columnas de este diagrama será precisa 
mente la característica de Weyr. Para el caso considerado es igual a (4, 4, 4, 
21,1) 

12. Toda matriz con divisores elementales irreducibles se denomina semi- 
simple. Demuéstrese que cualquier matriz A puede ser descompuesta en la suma 
de una matriz semisimple y otra nilpotente permutables entre sí y que esta 
descomposición es única. 


$ 16. Funciones de matrices 


En este parágrafo serán considerados aquellos problemas del cálculo 
de matrices en la solución de los cuales se emplea la posibilidad de 
reducir las matrices a la forma normal de Jordan. De acuerdo con 
esto se aceptará que el campo principal es el cuerpo de todos los 
números complejos. 

16.1. Polinomio en una matriz de Jordan. Las funciones de ma- 
trices más sencillas son los polinomios. Más tarde daremos la defi- 
nición general de función de una matriz, mientras que ahora dare- 
mos la expresión explícita de un polinomio en una matriz que tiene la 
forma normal de Jordan. Consideremos primero una célula aislada 
de Jordan de orden n . 


pl 00 
p1 00 
A= al. (1) 
pi 
p 
Demostremos que para cualesquiera valores naturales de m es válida 
da fórmula 
A (p21) p72 
an= pen |, e) 


donde se ha tomado 
my o mimi). (m—k+1) 
( k )= Baol > 


El método de demostración más sencillo es por inducción se- 
gún m. Para m=1 la fórmula (2) coincide con (1) y por lo tanto 
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es verídica. Por otro lado, si la igualdad (2) es válida para un 
valor de m, multiplicándola por A, obtendremos, mediante el cálculo 
directo, que la fórmula (2) es también válida para A+ 
Sea ahora f (à) un polinomio en A: 
atrapo As, 
Tenemos, por definición, 
HA =a Etan Atan Ann At. 


Introduciendo aquí en lugar de las matrices A” sus valores de (2), 
veremos que en la ¿-ésima fila y en la (i+s)-ésima columna de la 
matriz f (A) aparece la expresión 


r 
m0 AMS) a 1 
A pt T 


Por consiguiente, obtenemos definitivamente que 


Fro erao) aro genio] 
ias IO WO o la 


T 


de KORI 
Hemos calculado el valor de un polinomio en una célula de Jordan. 
Pero una matriz general de Jordan A es una suma directa de célu- 
las aisladas de Jordan: 

ASAFA +... +4, 
y según el p. 1.4 tenemos 
HASHASH H. HAD 4 
Aquí f(A), ... F(4,) son polinomios en células aisladas de Jordan 
y sus expresiones vienen dadas por la fórmula (3). Este resultado 
se puede aplicar también para el cálculo de polinomios en matri- 
ces A que no tienen la forma de Jordan. En efecto, determinamos 
primero una matriz 7 tal que la matriz 7-*AT =B tenga la forma 
normal de Jordan, calculamos después f(B) empleando las fórmu- 
las (3) y (4) y, finalmente, teniendo en cuenta la relación 
HA) =HTBT=")=Tf(B)T= 

(p. 3.1) obtenemos el valor de f(A). 


16.2. Funciones escalares. El concepto general de funciones ma- 
triciales se define de la misma forma absolutamente que el concepto 
de funciones numéricas corrientes. A saber, consideremos un conjunto 
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de matrices WM. Si a toda matriz A de M se pone en correspondencia 
una matriz B, se dice que B es una función de A definida sobre M. 
Queremos ahora poner en correspondencia a toda función numérica 
corriente p =f (A) —que está definida sobre un conjunto de números 
complejos y que satisface las condiciones indicadas más abajo—una 
determinada función matricial } (4). Esta correspondencia se obtiene 
del modo siguiente, Sean dadas una función numérica p=f (A) y una 
matriz arbitraria A. Indiquemos por Pi, Pe -:=, Ps los diferentes 
valores propios de la matriz A. Reduzcamos A a la forma normal 
de Jordan 


TAAT=B=B,+B,+...+Bp 


donde B,,..., B, son células de Jordan, y consideremos una de 
estas células, por ejemplo, la célula 


Fp, 10... 


a=) Pha | © 
Pid 


que corresponde al divisor elemental (A—p;)™. Si la función f(A) 
está definida en una vecindad del punto p; y tiene derivadas finitas 
Ple), +... F=D(p,), tomamos por definición 


Frio hred. piro) 


HB) = FO) +... IN) A (6) 
Ra A F 

Además, si f (ìà) está definida en una vecindad de cada uno de los 
puntos pj, ..., Ps y tiene en estas vecindades derivadas de orden 

adecuado, tomamos también 
F=f B) HHBDH -AFB (7) 

y 

HA) =THB)T"=T (FB) -EBT (8) 


La matriz f(A) se ilama valor de la función f (à) para à= A. Más 
abajo se demuestra que f(A) no depende de cómo se reduce la 
mátriz A a la forma normal" y es, por consiguiente, una función 
matricial de A. Esta función se denomina correspondiente a la fun- 
ción numérica f (A). Está claro que no todas, ni mucho menos, 
funciones matriciales poseen las correspondientes funciones numéricas. 


1 Es decir, de cómo se escoge la matriz T. 
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Aquellas para las cuales existen funciones numéricas correspon- 
dientes se denominan funciones escalares. 

Indiquemos algunas propiedades elementales de las funciones 
escalares: 

A) Si f (à) es un polinomio en A, el valor de la función escalar 
f(A) coincide con el valor del polinomio F(A) para A= A en el 
sentido del p.1.2. 

Efectivamente, la propia definición de las funciones escalares se 
ha realizado de modo que, para el caso de polinomios, coincida 
con la antigua. 

B) Sea A una matriz y sean f, (à) y f,(0) unas funciones nu- 
méricas para las cuales tienen sentido las exprealones $ (A) y h (A). 
Si POSEE A), también f(A) tiene sentido y (A) =f, (A)+ 
( 


O) Si A es una matriz, f, (à) y f, (à) son unas funciones numé- 
ricas tales que f, (A) y f,(A) tienen sentido y si f(A) =f, O) fa 0), 
también f(A) tiene sentido y F(4)=f,(4)f,(4). 

Las demostraciones de las propiedades B) y C) son semejantes 
y por ello nos limitaremos al caso de la propiedad C). Para calcu- 
lar los valores f,(4), f,(4) y f(A) debemos, por definición, reducir 
A a la forma normal de Jordan B y emplear las fórmulas (7) y (8). 
Ši se logra demostrar que /(8)=[.(8)/,(8), de la fórmula (8) 
resultará directamente que f (A) =f, (A) fa (4). Por otro lado, se tiene 

HB) =F B) HF (B) +... HB), 
Fa (B) fa (B) = fa (B3) fa (B) +- + fa (B3) fa (B0 
y, por consiguiente, todo se reduce a la demostración de las igual- 


dades 
I(Bp=h(B)h(B) (i=1, 2, ..., D, 


donde B; son células de Jordan. Tomando los valores de f,(B,) y 
fa(B;) según las fórmulas (6) y multiplicándolos, veremos que en 
la k-ésima fila y en la (k + /)-ésima columna de la matriz f, (B,) fs (B) 
aparece el elemento igual a 


A OEREO gom O AOS 
Esta expresión puede ser representada en la forma 
ABORAR p+.. PRO] 


que, de acuerdo con la regla de la derivada de un producto de fun- 
ciones, coincide con ñ f” (p). Por consiguiente 


h (B) fa (B) =F (B) 
y la proposición C) queda demostrada, 
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Análogamente, empleando esta vez la regla de la derivación de 
una función de función, se podría demostrar que siendo p (å) y F(p (2) 
funciones numéricas que satisfacen las condiciones en las que la 
expresión f(p(4)) tenga sentido y siendo (A) =f(p(A)) se tiene 
v(4) =FH6 (4). $ 

D) Sea A una matriz cuyos valores propios son P, Pae --..> Pr 
con la particularidad de que todo valor propio aparece aquí tantas 
veces como su multiplicidad lo indique. Si f(A) es una función 
numérica y si f(A) tiene sentido, los valores propios de la matriz 
HA, son iguales a f(p,), f (Pa), .... F (Pa). 

n efecto, los valores propios respectivos de las matrices f(A) 
y T“ (AT -IAT coinciden y, por lo tanto, podemos aceptar 
que A tiene la forma normal de Jordan. Las fórmulas (5) y (6) 
muestran que en este caso f(A) tiene la forma triangular con la 
particularidad de que a lo largo de la diagonal principal de f(A) 
figuran los números F(p,), F(0s), -.., f (Pn). Puesto que los elemen- 
tos diagonales de una matriz triangular son sus valores propios, la 
proposición D) queda demostrada. 

Consideremos dos ejemplos. 1) Sea f(A)=2”!. Esta función está 
definida en todo punto, salvo 2=0, y para todos los valores de A 
diferentes de cero tiene derivadas de cualquier orden. Por consi- 
guiente, si la matriz A no posee valores propios nulos, es decir, 
si A es regular, resulta que Fa tiene sentido. Pero A.f (A) =} 
y por lo tanto A-f(4)=E, de donde tenemos f(4)= A~. Es decir, 
a la función A”! le corresponde la matriz inversa. 

2) Sea f (à)= VÑ. Para à 0 esta función tiene derivadas finitas 
de cualquier orden. Por consiguiente, la expresión V A tiene sentido 
para todas las matrices regulares A". Tomando A=A en la 


relación 
INEASA 


FAFA) =A. 


Hemos demostrado, por consiguiente, que de toda matriz regular se 
puede extraer la raíz cuadrada. 


16.3, Representación de los valores de funciones por_polinomios. 
En todos los cursos del Algebra superior se considera el problema 
de cómo a partir de un sistema dado de números diferentes p,, Pa, 
..., Ps y de otro sistema cualquiera de números œ, A, ..., œ, 
obtener un polinomio f(A) que en los puntos P,, Pa, ..., Ps tome 


obtenemos 


D Para evitar la multiformidad de VF y hacer más rigurosos los razona- 
mientos, es suficiente efectuar en el plano complejo de la variable A un corte 
desde el origen de coordenadas a lo largo de un rayo que no contenga ninguno 
de los valores propios de la malriz A y considerar sólo una de las ramas del 
radical. 
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los valores œ, œ, ..., a, respectivamente. La solución se ofrece 
en forma del conocido polinomio de interpolación de Lagrange. 

En lo sucesivo será importante saber constriur los polinomios 
cuando tanto ellos como sus derivadas hasta un orden determinado 
toman los valores dados en los puntos Pp, Ps, ..., ps. Este problema 
es, por consiguiente, una generalización directa del problema ante- 
rior. Enunciemos la proposición referente a su solución en forma de 
un lema especial. 

LEMA, Sean Pi Pa -.., Ps Unos números diferentes dados y sea 
dada una tabla de (k+1)s números cualesquiera a; Existe un poli- 
nomio p(h) que en todo punto p; toma el valor œ; mientras que su 
jrésima derivada toma el valor ay (i=1,2, ..., 5 I=1, ..., k). 

Primero conviene construir un polinomio auxiliar p; (A) que tanto 
él como sus derivadas hasta el orden k tomen los valores requeridos 
solamente en el punto p, y se anulen en los demás puntos. Tomemos 


PA) = Biot Ba A+ HB AP, 
DRA. A AA prr)". AA, 
PA= p A) D A), 
donde Bj, Ba» -.., Pia son unos números por ahora indeterminados. 
Es evidente que para cualesquiera valores de Bi, ..., Pia se tiene 
plo)=»0p=...=pP(p)=0 (Hi). 
De acuerdo a la regla de la derivación de un producto tenemos 
PP) = PP (P) Pi (P) H10? PAD O+ -H p P) DS? (0i), 
es decir, 
ai= i1 Bey Di (P + 11 Bi, 21 DH -o A Bio DP (Pi). (9) 


Como ®; (p) 0, tomando ¡=0, 1, ..., k podemos determinar de 
las relaciones (9) sucesivamente los números Bi» Biz, ---, Bra y, con 
ello, calcular p,(A). El polinomio 

PRSP HA) -o + p (A) 
satistará, obviamente, las condiciones del lema. 

Consideremos una función numérica f (À) y una matriz A tal que 
el valor f(A) esté definido. Probemos que existe entonces un poli- 
nomio p(A) tal que p(A) es igual a f(A). Indiquemos por P,. Py, 
s. +, Ps los distintos valores propios de la matriz A. Sea n su orden. 
De acuerdo con el lema que acabamos de demostrar podemos con- 
struir un polinomio p(A) que satisfaga las condiciones siguientes» 


Dolppr=HD. P PD=F P e D o= f” (pp) (10) 
(=l, ..., 8). 


» Si algunas de las derivadas gren sobran para la determinación de f (A), 
Jos números correspondientes de (10) pueden ser sustituidos por ceros. 
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Para determinar el sentido de la expresión f(A) sólo necesitamos 
conocer los valores que toman en los puntos P,, P» ..., P, la función 
F() y sus derivadas hasta el orden n—1 a lo sumo. Puesto que 
estos valores de f (à) y de p() coinciden, resulta que f (A) = p (A). 
Es decir, hemos obtenido el siguiente resultado: 

TEOREMA 1, Los valores de todas las funciones escalares de una 
matriz A pueden ser representados mediante polinomios en A”. 
En particular, considerando la función f(A)=WA' vemos que 


para toda matriz regular A existe un polinomio p(A) tal que 
p(A)p(A)= A. 


Empleando el teorema 1 es fácil resolver el problema que hemos 
dejado pendiente en el punto anterior acerca de la unicidad de la 
delerminación del valor de f(A). En efecto, conociendo los valores 
de la función f(A) y de sus derivadas en los puntos p,, ..., p, po- 
demos construir el polinomio pO) cuyo valor p(A) no depende de 
cómo se reduce la matriz A a la forma normal de Jordan y coin- 
cide, al mismo tiempo, con el valor ¿(A). Es decir, el valor f (A), 
definido en el punto anterior mediante la reducción de la matri: 

a la forma normal, no depende de cómo se realiza esta reducción. 

Hagamos una observación más. Sea f(A) una función numérica 
y sea A una matriz tal que f(A) tiene sentido. En virtud del 
teorema 1 podemos hallar un polinomio p0) tal que p(A)=f(4). 
Dada la función f(A), el polinomio p(A) depende sólo de los divi- 
sores elementales de la matriz A. Pero los divisores elementales de 
la matriz A y de la matriz a A' coinciden y, por ello, 
se tiene PARS AN. Es fácil deducir del punto 1.3 que p(4') = 
= p (A). Es decir, para toda función escalar f (A) tenemos f (A”) =} (Ay 


16.4. Divisores elementales de funciones. Estudiemos el problema 


de cómo determinar a partir de los divisores elementales de una 
matriz A los divisores elementales de una de sus funciones escala- 
res f(A). Reduzcamos A a la forma normal 


TAAT=B=B,+8B,+...+Bp, ai) 
B, son células de Jordan. Por definición, 
HA)=THB)T= 


y, por consiguiente, los divisores elementales de las matrices f(A) 
y F(B) coinciden. De (11) se desprende que 


HB = HB) HBIR.-: HEB 


D» Notemos una vez más que, según los razonamientos expuestos en el texto, 
todo valor / (4) de una función escalar f dada se puede representar mediante un 
polinomio p(A). Sin embargo, para una misma función f este polinomio será 
diferente, según sean diferentes las matrices A, 


donde By; 
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luego, el sistema de los divisores elementales de la matriz f (B) 
es Ta unién de los sistemas de los divisores elementales de las célula 
HB), ...» f (Bi). Es decir, nuestro problema inicial se reduce al 
siguiente: dada una célula de Jordan B; de divisor elemental 
(A—p,)"" haltar los divisores elementales de f (B) 

En virtud de las fórmulas (5) y (6) tenemos 


[atred =F e). gi e 
1 


E, — Í (B) = acte) -aap e). (12) 
AFD 

Determinemos los máximos comunes divisores D, (à), D, (à), n 

+» Dm (4) de los menores de primero, segundo, ..., npésimo orden 


de esta matriz. El mayor de ellos D,,(?) es igual al determinante de 
la matriz, es decir, 
DuA) = (M— F p. 


Todos los demás son divisores de Da, (à) y, por consiguiente, son 
de la forma (A—f(p))". Consideremos Dp,-1 (4). Este polinomio 
debe ser un divisor de todos los menores de orden n,—1 de la 
matriz (12) y, en particular, del menor A (À) que se obtiene supri- 
miendo la primera columna y la última fila. Sin embargo, si en 
este menor se introduce en lugar de À el número f(p;), se obtiene 
una matriz de forma triangular y con los elementos — f' (p;) a lo 
largo de la diagonal principal y, por consiguiente, 


At)= =P P". (13) 


Supongamos ahora que f'(p;)7+0. La igualdad (13) muestra enton- 
ces que A(A) no es divisible por A—f(p,). Pero el polinomio 
D»,-1 (à) debe ser un divisor común de los polinomios A (A) y Dn (A), 
es decir, Day. 1 (A)=1. Los demás polinomios Da2 (à), ... D, (À), 
D,(%) son divisores de D,,.1(A) y, por ello, también son iguales 
a la unidad. Calculando los cocientes Da+,:D, vemos que los facto- 
res invariantes de la matriz (12) serán 1, ..., 1, (A—f(p,))"%, debido 
a lo cual la matriz (12) tendrá sólo un divisor elemental (A — f (9))'%. 
De aquí se desprende el teorema siguiente: 

TEOREMA 2. Sea A una matriz de valores propios P, ..., Ps 
y sea F(A) una función tal que f'(p) 0 (i=1, ..., s). Entonces, 
si la matriz f (A) existe, sus divisores elementales se pueden obtener 
sustituyendo cada uno de los divisores elementales (A—pJ" de la 
matriz A por la expresión (—f(p,)y. 

Por ejemplo, si A es una matriz regular y f(4)=2"1, se tiene 
F(A)=A™ y F(o)=—e7* 0. Luego, si sustituimos todo divisor 
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elemental (A—ppa* de la matriz A por la expresión (A—p7")"%, 
obtendremos el sistema de divisores elementales de la matriz inversa. 


El teorema 2 permite determinar los divisores elementales de la matriz 
[(4) pertenecientes a aquellos valores propios f (pj) para los cuales f' (p¡) # 0. 
No es difícil obtener la regla correspondiente también para el caso en que 
f (pi) =0. Supongamos que para un valor propio de una matriz A se tiene 


Pey=P)=...=/E-0(p)=0 y [0 (p) 0. (14) 


Queremos determinar en qué divisores elementales de la matriz f (4) se trans- 
forma cada uno de los divisores elementales (A—py)"! de la matriz A, Es obvio 
jue este problema se reduce al siguiente: determinar los divisores elementales 
le la matriz (5) en la condición (14). Para kzn; la matriz (5) resulta diago- 
nal y sus divisores elementales serán A—/ (9), — (pi). El caso k= 1 
ha sido examinado anteriormente: en este caso la matriz (12) tiene un único 
divisor elemental (A —f (pi). Por esto sólo nos interesarán los valores de Æ 
comprendidos entre 1 y nj 

nsideremos un espacio lineal auxiliar Y de dimensión n; y de base aj 


an -s app Pongamos para abreviar J: FÓ (p) =a, y ni==n e indiquemos 


por (6 la aplicación lineal del espacio £ que tiene la matrtz 
C=)(By—H (pi) Er 
Tenemos, por consiguiente, 


aB =ar Harpit + aa, 


ag = a 
NA o as 
Arab 

ag =0 G>2—h. 


Puesto que nos interesan los divisores elemantales de la aplicación $, tomare- 
mos en É otra base en la que la matriz de la aplicación $ tenga una forma 
más sencilla. Sea 


e= Buat Bi it Finn (==, 0.0 0) 


entonces 
=P iria) aienti t o 
Escojamos los números By de modo que se cumplan las relaciones 
8= ejer e/EO=0 i=l, 0... Aki j > nh). (16) 
Esto ofrece el siguiente sistema de ecuaciones respecto de f;y: 


Bi o BBs, irren + 


Teniendo en cuenta la condición Qp+, 56 0, de aquí se pueden determinar suce- 
sivamente los valores lr Lex»... expresándolos en términos de los valores 
de f con mayor prii indice. Para los valores Py, donde í æœn—k, no se 
obtiene ninguna ecuación, de modo que estos valores se pueden escoger arbi- 
trariamente. En particular, tomando Bj. x, »2==»» = Bnn = 1, obtendremos para 
los demás coeficientes iniciales Py, In—Ax1 amara Valores nulos. Las 
ecuaciones (18) pueden ser- resueltas entonces respecto de aj, Gs, ..., An; por 
esto el sistema er Ce .-., €, será uno base nueva de E que satisface las 
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condiciones (16). Descompongamos los vectores €r, ..., €, en los sistemas 
En erem Cieri + 


y consideremos los subespacios Ly, ..., Lẹ, tendidos sobre estos sistemas. Las 
felaciones (16) muestran que 2, es un subespacio invariante de base ej, ejere 


Eresma + Y que A 

l=1++. (47) 
En virtud de los resultados del p. 12.3, de aqui se desprende que la matriz 
de la aplicación '£ se descompone en Æ células de Jordan de divisores ele- 
mentales 2%, 2%, AX, donde my, my, ..., my son las dimensiones de 
los subespacios ly, La ly. La matriz de la aplicación inicial f (Bj) está 
ligada a la matriz C mediante lo fórmula f(B;)= (pi) E/+C y, por lo tanto, 
los divisores elementales de la matriz f (Bj) son (A—} (p;))™, Af p" 
Si empleamos el símbolo [æ] para indicar el mayor número entero que no sobre- 
pasa a «, obtendremos para m; my las expresiones sigulentes: 


Por consiguiente, sí la matriz A tiene un divisor elemental (A—p)m y si 
Pipa... fM=D(p)=0 y (H(p) Æ0, entonces al pasar de A a f(A) este 
divisor elemental se descompone en los divisores elementa'es (=p (p)™, 
(Af (p))”+, donde 


mo [EA], m= [2]. cer Mm [+ 


Consideremos un ejemplo. Supongamos que A tiene los divisores elementales 
AU. 9,0, 4,2) es preciso determinar los divisores elementales de la, matriz 
413464342 —E. En estas condiciones tenemos f (}.) = A0— 3At 4- 3A? — | sos 
TA DAHA PAA O fe Uz0 y 10) a o, Al, pasar a 1(4) 
el divisor elemental (A 4-2) se convierte en (A—/(—2)2=(4—27)%, mientras 
que el divisor elemental (A—1)% se descompone en 23, A? y 22, Por consigui- 
ente, los divisores elementales de la matriz / (4) serán A, A9, Àt y (A—27)2, 


16,5, Series de potencias. Una sucesión de matrices cuadradas 


e A PO PP (18) 


de un mismo orden se lama convergente hacía la matriz A, sl los elementos 
de las matrices (18) que aparecen en la intersección de una columna y de vna 
fila dadas convergen hacia el elemento correspondiente de la matriz A. De esta 
definición se desprende directamente que si las matrices Am y Bm convergen 
con el crecimiento de m hacia A y B, respectivamente, Jas matrices Am- 8, 
y AmBm convergen hacia A+B y AB. En particular, si T es una matriz 
consíante y la matriz An converge hacia A, resulta que T=14,7 tendrá como 
límite a la matriz T-*4F. Además, si 


Aa ARHAR H.. HAR (mal, 2, 


donde los ordenes de las células no dependen de m, 
el crecimiento de m hacia un límite determinado 


las células Al? converge hacia un límite. 


matriz Am converge con 
i, y sólo sl, cada una de 
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La última 


vación permite resolver fácilmente el problema de conver- 
gencia de las así 


madas series de potencias de matrices. 
atada Pd a9 
una serie formal respecto de la variable A. La expresión 
E E Han AnH. 
se llama serie de potencias correspondiente de la matriz A y el polinomio 
IA) =4E +A... Pop A" 
se llama n-ésima suma inicial de esta serle. Se dice que la serie (20) converge, 
si la sucesión de las sumas iniciales f, (4) » Ím (A), .-. tiene limite; en 


el çaso de su existencia este limite se denomina suma de la serie (20). 
“Reduzcamos la matriz A a la forma normal 


T-1AT = B=B8B, 48,4... 4 Bh 


donde Bj, ..., Bp son células de Jordan. Hemos visto más arriba que la con- 
vergencia de a sucesión fa(A) equivale a la convergencia de la sucesión 
Tf, (A)T (mel, 2, ...). Pero 


TA (A)T Sa (TAT) =la (B)= fn (BDH -H in (80, 
es decir, el problema acerca de la convergencia de la serie (20) equivale al 
siguiente: ¿bajo qué condiciones converge esta serie para las células de Jordan 
a «+. Bi? Consideremos una de estas células, por ejemplo, la célula Bj. 


Sea (A—p¿J'" el divisor elemental que le corresponde. Según la fórmula (3) 
tenemos 


(20) 


MA 
E Ímt0d > =p G 


Ín (B) = ra o) |. 


L men 


por consiguiente, In (B;) converge hacia un límite con el crecimiento de m si, 
y sólo si, fm (Pi) fm (Pih ==0» FRI (pp) convergen hacia unos limites, es 
decir, si en el punto pz convergen tanto la serie (19) como las series que se 
obtienen de ella derivándola término por término n¡—1 veces sucesivas. De 
la teoría de las funciones an: icas se sabe que todas estas series convergen 
indudablemente, si p; pertenece al interior del círculo de convergencia de la 
serie (19) o si e ler a la circunferencia del círculo de convergencia y 
la (n;—1)-ésima derivada de la serie (19) converge en el punto pz. Es decir, 
hemos demostrado el teorema siguiente: 

TEOREMA 3. Para que una serie de polencias de una matriz A converja es 
necesario y sufictente que todo valor propio p; de la matriz A se halle en el 
interior del círculo de convergencia de la correspondiente serie de potencias f(A) 
o que se halle sobre la circunferencia del circulo de convergencia, pero con la 
particularidad de ye la serie, A ta obtiene derivando n¡—1 veces la serie de 
F(A), converja en el punto p; ne es el grado del mayor divisor elemental 
correspondiente a py. ` 


16.6. Matrices conmutables con una matriz dada. Dos matrices 
A y B se llaman conmulables, si AB=BA. Toda matriz es con- 
mutable con sí misma y con la matriz unidad. Además, si A es 


131843 
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conmutable con las matrices B y C, las igualdades 
A-BC=BAC=BC-A, 

A(aB+BC)=0AB+PAC=aBA+PCA = (aB +C) A 
muestran que A es conmutable con el producto y las combinacio- 
nes lineales de las mismas. Luego, si B es conmutable con A, 
resulta que B es conmutable con cualquier polinomio en A. En 
particular, A es conmutable con los polinomios en A y cualesquiera 
dos polinomios en A son conmutables. 

egún el p. 16.3, los valores de las funciones escalares de una 
matriz A pueden ser representados mediante polinomios en A. 
Los polinomios en A son conmutables con toda matriz B que sea 
conmutable con A, Por consiguiente, el valor de toda función esca- 
lar de una matriz A es conmutable con todas las matrices que son 
conmutables con A. 

La relación «E-P =P-aẸ£ muestra que las matrices aE son con- 
mutables con todas las matrices del mismo orden. La recíproca tam- 
bién es válida: 

Si una matriz cuadrada A de orden n es conmutable con todas 
las matrices de orden n, la matriz A es de la fornia aE. 

Indiquemos por «;, los elementos de la matriz A. Sea P la 
matriz que contiene la unidad en la p-ésima fila y en la g-ésima 
columna, mientras que todas sus demás posiciones están ocupadas 
por ceros. Realizando la multiplicación directa obtenemos 


w FO piast 
ð si 


y PA=| agn ap > 


a cen, 07. 
donde aparecen escritas la g-ésima columna de la primera matriz 
y la pésima fila de la segunda. Como, por hipótesis, AP= PA, 
resulte que %),,=0,, Y que %,¿=0, si pg. Puesto que p y q 
son arbitrarios, esto significa que A es diagonal y que todos sus 
elementos diagonales son iguales. 

Consideremos ahora un problema más complejo: hallar todas 
las matrices conmutables con una matriz dada A. 

Para resolverlo, reduciremos A a la forma normal de Jordan 


TAAT=B=B,4B,+...4B, (21) 
donde B,, ..., B, son células de Jordan. Si la matriz X es con- 
mutable con B, es obvio que Y=TXT”* es conmutable con A y, 
recíprocamente, si Y conmuta con A, también T-1YT =X conmula 
con B. Por lo tanto, todo el problema se reduce a determinar las 
matrices X que conmutan con la matriz B que tiene la forma 
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normal (21). De acuerdo con (21) descompongamos en células tam- 
bién la matriz X 

Xu Xoas.. Xi 
MESE Kal, 


a Mosaic A 
La condición BX=XB lleva a las igualdades 
BXp9=XpBg (0, 9=l, 0018) (22) 


Vemos que para cada una de las células X, se obtiene una sola 
igualdad (22) de la cual debemos determinar fos elementos de X pg 
Supongamos que los órdenes de las matrices B, y B, son k y m, 
respectivamente, M que sus valores propios son p y o. En este caso 
Xpy será una matriz rectangular de % filas y de m columnas, Indi- 
qúemos por y (i=1, ..., k; j=1, ..., m) los elementos de la 
matriz Xy y tepresentemos la relación (22) en forma detallada 


pro. Bu Bn >>> Bm] Fén È El] polo. 
| pl d [El Eje 5 | GE 
“el limbn- El Uen ta:t 


Realizando aquí la multiplicación y comparando el elemento que 
se obtiene en la ¿-ésima fila y ¡-ésima columna del primer miembro 
con el elemento correspondiente del segundo miembro, llegamos a 
las ecuaciones 


yd En oy (ik, 1A 1), (23) 

PEy=Ex jeit Èa (=k, 191), (24) 

Pm = Ës (=k, ¡=1). (25) 

Si p 0, de (25) se deduce que E,, =0; entonces de (24) obtenemos 

sucesivamente Ex =... =Esn=0 y de (23) concluimos que todos 

los demás E, son también iguales a cero. Por consiguiente, para 
pg tenemos Xp», 


Consideremos éf caso p=0. Las ecuaciones (23). (24) y (25) se 
convierten entonces en 


Enatija Udo bf oea m), (20) 
En =0 G m). (27) 


reduciremos 


Sea k>m; poniendo Sai tamis ass 
a las ecuaciones 


las ecuaciones (26) y (2 
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de donde resulta que la matriz Xg tiene la forma triangular lineal 


ES 
sl E El (28) 


para k=m y, respectivamente, la forma 


En En Es --- 


1 Es 


Xp 


000 
Lo 00 ol 
para k>m. Siendo $< m y tomando Ẹ,, m-4+, = 


1, En En mata =bn 
22.» Em= Es reduciremos las ecuaciones (23), (24) y (25) a las 
ecuaciones 


Ey=Ejicaro U—i>m—k), 
Ey =0 U—i<m—k), 


que significan que la matriz Xpo es de la forma 
055 En 
00 ii bal, 

000 E 


Recíprocamente, si las células de la matriz X tienen la forma se- 
ñalada, las ecuaciones (23), (24) y (25) se satisfacen y, por consi- 
guiente, X conmuta con B 

Por ejemplo, si 


p 10], feolo 
a-[ os Japo +f 0] ero 
P. P 9 


las matrices que conmutan con B son de la forma 


donde æ, B; y, y 5, son números arbitrarios. 
Este resultado se hace sumamente sencillo para matrices de tipo 
E Ho +... +p,E,, donde E,, ..., E, son matrices unidades 
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y todos los números p, ..., p, son diferentes. En este caso las 
células X, son nulas para pq y X adquiere la forma celular 
diagonal. 

n particular, si B es diagonal y sus elementos diagonales son 
distintos, las matrices conmutables con B son también “diagonales. 


16.7, Matrices que conmutan con matrices conmutables. Los po- 
linomios en una matriz A poseen la propiedad especifica de que, 
además de conmutar con la propia matriz A, conmutan con cual- 
quier matriz X que es conmutable con A. Resulta que esta propiedad 
es caracteristica para los polinomios en A. 

TEOREMA 4. Sí la matriz C conmuta con todas las matrices que 
conmutan con B, C es un polinomio en B. 

Es obvio que basta realizar la demostración para el caso en 
que B tiene la forma normal de Jordan; sea, pues, 


B=B,+B,+...+Bs 


donde B,, ..., B, son células de Jordan. Las matrices auxiliares 
X=0, E +0,E,+...+0,E,, 
donde a, ..., œ, son números arbitrarios y E,, ..., E, son ma- 


trices unidades, conmutan indudablemente con B y, por ello, las 
matrices X conmutan también con C. De aquí se deduce, de acuerdo 
con lo expuesto anteriormente, que C se descompone en células: 


C=C, 4C, +... +Cj (30) 


además de la condición CB=BC resulta que estas células tienen la 
forma lineal triangular (28). Sea ahora X una matriz arbitraria que 
conmuta con B. La forma general de la matriz X ha sido determinada 
en el punto anterior. Según las condiciones del teorema que estamos 
demostrando, la matriz € debe conmutar con X. Representando X 
en la forma celular veremos que la igualdad CX=XC equivale 
a las relaciones 


Onak (0,9 3). en 


Si las células correspondientes B, y B, tienen diferentes valores 
propios, nada resulta de (31) ya que en este caso X,,=0. Por esto 
aceptaremos que los valores propios de las célutas B, y B, coinci- 


den. Sea 
0 Ba 
mota 


Supongamos, para concretar, que k< m. Entonces la relación (31) 
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se convierte en 


donde E,, Ej, ..., En son números arbitrarios. Multiplicando en el 
primer y en el segundo miembros la primera fila por la última co- 
lumna e igualando los resultados, obtenemos 


abet arit -o H aaka = Biba H Babai H + o e H Babn 


de donde, debido a la arbitrariedad de los números $,, ..., Ez re- 
sulta que 


AB, =P... aa = Bae (32) 


Es fácil comprobar que semejantes igualdades se obtienen también 
en el caso en que k>m. Las igualdades (30), (31) y (32) consti- 
tuyen un sistema completo de condiciones a las que debe someterse 
la matriz incógnita C. Para hacer estas condiciones más claras, procede- 
remos del modo siguiente. Coloquemos las células de Jordan de la 
matriz B de manera que las células con los valores propios iguales 
estén al lado una de otra. Sea, por ejemplo, 


B=(B, 4... + Bm) + (Bms 4... + Bm) H- 


Bat + HB), 
donde en cada uno de los paréntesis figuran células con valores pro- 
pios iguales. Indicando las sumas de estos paréntesis por B', ... B'1, 
la matriz B quedará dividida en células mayores que denominare- 


mos bloques. De acuerdo con esto también las matrices X H C que- 
darán divididas en bloques respectivos. Los resultados del punto 
anterior muestran que todos los bloques no diagonales de la ma- 
triz X son iguales a cero; en cuanto a los bloques diagonales de X, 
éstos tienen la estructura descrita en aquel punto. Las condiciones 
obtenidas en el punto presente para la matriz C muestran que sus 
bloques diagonales también se descomponen, igual que en el caso 
de B, en células, con la particularidad de que las células de la 
matriz C tienen una forma triangular especial. Las igualdades (32) 
significan que en las células de la matriz C, pertenecientes a un 
mismo bloque, los elementos que figuran en una misma línea para- 
lela a la diagonal principal son iguales. 
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Sea, por ejemplo, B la matriz (29) considerada a título de 
ejemplo al final del punto anterior. Nuestros resultados muestran 


que la matriz C que conmuta con toda matriz conmutable con B 
será de la forma 


Fas a a 3 
Lo 2 


r (83) 


E i M 
Resla probar que C se puede representar en forma de un poli- 
nomio en B. Haremos esto para el caso particular en que B es de 
la forma (29) y, por consiguiente, C tiene la forma (33); en el caso 
general los razonamientos son los mismos. Es decir, debemos probar 
que la matriz (33) es un polinomio en la matriz (29). Busquemos 
un polinomio f(A) que satisfaga las condiciones 


F= F= Flo) =a 
H(0)=%, f(0)=%, F0) =h 


Según el p. 16.3 existe un polinomio de esta índole. Aplicando la 
regla (3) del p. 16.1 veremos que f (B) =C. 


Ejemplos y problemas 
1. Hállese An, si 


4 a2 
A=|0-3-2 
0.4 3 


2. Háliense todas las soluciones de la ecuación X3=A, donde A tiene el 
mismo valor que en el problema anterior. ¿Cuáles de estas soluciones serán poli” 
nomios en A? Calcúlense sen sA, eå y cos A. 

3. Los divisores elementales de una aplicación A son iguales a 15, (A—1)2 y 


A+ + Calcúlense los divisores elementales de las aplicaciones cos A y sen 4. 


4. SI A y B son matrices que conmulan, se tiene ¿4eB=04+B, 

5. ¿Para qué matrices A tiene solución la ecuación A==eX? 

6. Si f (à) indica la suma de la serie de potencias (19), la suma de la serie 
de polencias (20), si es que esta serie converge, será igual a f (4). 

7. Hállese la forma general de la matriz que conmuta con una matriz nor- 
mal de Jordan A, si los divisores elementales de A son (A—1P, (A—1)%, A— t 
A+ y +2 

8. Supongamos que todos los factores invariantes de la matriz AE— A, 
salvo el último, son iguales a 1. Entonces toda matriz conmutable con A es un 
polinomio en Á. 


Capítulo V Espacios unitarios 
y euclídeos 


Los espacios lineales que hemos estudiado en los capitulos 

anteriores han resultado ser, en determinado sentido, más pobres 
en conceptos y propiedades que nuestro espacio corriente, En la 
teoria general de los espacios lineales no han quedado reflejados 
conceptos como la longitud de un segmento, la magnitud del ángulo 
y el producto escalar que desempeñan un papel primordial en la 
eometría. Por esto, si queremos que la teoría general abarque 
Todas las propiedades más esenciales del espacio corriente, debemos 
introducir, además de las operaciones de adición de vectores y de 
multiplicación de los mismos por números, la operación de multi- 
plicación escalar. En este capítulo se estudian precisamente las 
propiedades de los vectores pertenecientes a espacios provistos del 
producto escalar. 

En este capítulo el cuerpo principal es de carácter muy espe- 
cial: es el cuerpo de los números reales en el caso de espacios 
euclídeos y es el cuerpo de los números complejos en el caso de 
espacios unitarios. 


$ 17. Espacios unitarios 


17.1. Axiomática y ejemplos. Sea X nuestro espacio corriente 
cuyos vectores son los segmentos orientados que parten de un punto 
inicial O. Se llama producto escalar (a, b) de los vectores a y b el 
producto de las longitudes de a y de b por el coseno del ángulo 
que forman estos vectores. De aquí se desprenden directamente las 
conocidas propiedades del producto escalar: 

(a) (a, b)=(b, a); 

(b) (aa, b) =a (a, b); 

(c) (a+b, c)= (a, c)+ (b, c); 

(d) si a0, se tiene (a, a) > 0. 
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Tomemos en el espacio R un sistema de coordenadas formado 
por tres cualesquiera vectores e,, e, y ey, perpendiculares dos a dos, 
de longitud 1. Entonces todo vector a admite una representación 
única de la forma 


a= 0e, + 06, + Ola, 


donde æ, a, y a, son las longitudes de las proyecciones del vec- 
tor a sobre los ejes coordenados, tomadas con signo adecuado. Si 


b= Bie, +Bae, + Bats 


es otro vector cualquiera, resulta de la definición del producto 
escalar y de las propiedades (b) y (c) que 


(a, b) = aBa + Ba + Pa. (1) 
El espacio R es real. Esto se expresa en que las proyecciones, 


las longitudes y los productos escalares de los vectores son números 
reales. Sin em argo, en algunos casos surge la necesidad de consi- 
derar vectores de proyecciones complejas. A primera vista parece 
natural tomar de nuevo la expresión (1) para el producto escalar 
de vectores con coordenadas complejas %,, a, œ, Y Be Ba Pa. En 
algunos casos se procede precisamente de este modo. El espacio 
que así resulta se denomina espacio euclideo complejo. Por desgracia, 
el producto escalar pierde entonces muchas propiedades importantes 
y entre ellas la propiedad (d) de importancia primordial. En efecto, 
para el vector 


a=32, +4e, +5ie, (i =V =T) 

de la fórmula (1) resulta 

(a, a) =94+16-+ 251% =0 
contrariamente a la propiedad (d). Para evitar este inconveniente, 
en lugar de la expresión (1) se toma como definición del producto 
escalar de vectores complejos la expresión 

(a, b) = aB, +08, + oba, 102) 
donde la raya superior significa que ha de pasarse a los números 
complejos conjugados. En el caso en que los vectores a y b son 
reales, tenemos f,=P, y la expresión (2) coincide con (1). Por 
consiguiente, la nueva definición (2) es una generalización de la 
anterior. Por otra parte, con la nueva definición la propiedad (d) 
se cumple sin duda alguna, ya que de (2) resulta: 


(a, a) =0% +04 Ham la +10, 141091, 


donde Ja] es el módulo del número aj. Es fácil ver que las pro- 
piedades (b) y (c) también se verifican. En cuanto a la propiedad 
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(a), toma una forma distinta en el caso de vectores complejos. 
Efectivamente, de (2) se tiene 


(b, a) = Bit, + Bats + Bats =P 0, + Poo, Britus 
es decir, 
(a*) (b, a)= (a, b). 


El espacio de vectores complejos en el que el producto escalar 
se calcula mediante ła fórmula (2) se denomina unitario. La fór- 
mula (a*) muestra que las propiedades del espacio unitario difieran, 
en general, de las propiedades del espacio corriente, No obstante, 
estas diferencias son de poca importancia, En todo caso, el espacio 
unitario se aproxima más por sus propiedades al espacio corriente 
que el espacio euclídeo complejo mencionado anteriormente. 

Los razonamientos que hemos expuesto no pueden calificarse de 
totalmente precisos. Además, hemos considerado el caso de un 
espacio de tres dimensiones. Por esto debemos dar ahora una defi- 
nición totalmente rigurosa de los espacios unitarios que sea válida 
también para espacios de cualquier dimensión. 

En la teoría general de espacios lineales hemos realizado casi 
toda la exposición aceptando que el cuerpo principal K es total. 
mente arbitrario. En el capítulo presente K será o bien el cuerpo 
de todos los números complejos o bien el cuerpo de todos los nú- 
meros reales. 

Un espacio lineal L sobre un campo K se llama unitario, si 
a todo par de vectores a y b de £ tomados en un orden determi- 
hado corresponde un número de K llamado producto escalar (a, b) 
del vector a por el vector b que posee las propiedades siguientes: 

1° (a, b) = (b, a); 

2 (aa, b) =a (a, b); 

3 (atb, c) = (a, ¢) + (b, 0); 

4 si a20, se tiene (a, a) > 0. 

En el caso en que el campo principal K es el cuerpo de los 
números reales, el espacio unitario L se denomina espacio unitario 
real o simplemente espacio euclideo real. En este caso la expresión 
(a, b) coincide, obviamente, con la expresión (a, b) y el axioma 1° 
adquiere una forma más sencilla: (a, b) = (b, a). 

Si el campo K es el cuerpo de los números complejos, el espa- 
cio £ se llama espacio complejo unitario. En lo sucesivo las propie- 
dades de los espacios euclídeos reales y las propiedades de los 
espacios complejos unitarios serán examinadas, en la mayoría de 
los casos, conjuntamente y por espacio unitario se comprenderá, de 
acuerdo con la definición, o bien el espacio unitario real o bien 
el espacio unitario complejo. 
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Notemos también que en la definición de los espacios unitarios 
no se exige que el espacio sea de dimensión finita. Por esto cabe 
hablar también de espacios unitarios de dimensión infinita. Aun 
cuando algunas propiedades de los espacios unitarios no dependen 
de la dimensión de los mismos, nos limitaremos a considerar, 
mientras que no se diga lo contrario, solamente espacios de dimen- 
sión finita. La teoría de espacios de dimensión infinita entra de 
lleno gn una disciplina matemática especial que es el Análisis fun- 
cional. 

De las propiedades 1° y 2 resulta 


(aa, Bb) = a (a, Bb) =a (Bb, a) = af 
es decir 


(6, a) =0Bla, b), 


(aa, Bb) = aĝ (a, b). (8) 
Análogamente de 1°, 2 y 3” se desprende que 


(a,b4-c)=(b+0, a)=(b, a)+(c, aj=(a, b)+ (a, c). 


De aquí obtenemos, mediante el procedimiento corriente, la fór- 
mula general 


oaa, E) =ED 28ula, ba). (1% 
Para a=1 y P=0 de la relación (3) resulta 
(a, 0)=(0, a) =0. 
Señalemos dos ejemplos. Consideremos el espacio lineal de filas 
de longitud n con elementos del campo K. Convengamos en llamar 


producto escalar de la fila a=[%;, . ..., %) por la fila b= [B,, +... Ba} 
la expresión 


(a, b) =a, +0 B,+--- H an- 6) 
De esta expresión se ve que 
a amant... Heal +10. (6) 


Puesto cue los módulos |a,| son números reales no negativos, la 
suma de sus cuadrados será un número real no negativo que será 
igual a cero sólo en el caso en que sean iguales a cero todos sus 
sumandos. Por consiguiente, la propiedad 4° aquí se cumple. Es 
obvio que las propiedades 1°, 2° y 3” también se cumplen, de modo 
que el espacio de filas con el producto escalar (5) es un espacio 
unitario de dimensión n sobre el campo K. Este ejemplo es de una 
importancia primordial ya que más adelante quedará demostrado 
que todos los espacios unitarios de dimensión n sobre el campo K 
son isomorfos. 

Como ejemplo de espacio unitario de dimensión infinita puede 
servir el espacio Y de todas las funciones continuas f (t) de valores 
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complejos definidas sobre el segmento (0, 1]. La adición y la mul- 
tiplicación por número de estas funciones se definen de modo cor- 
riente y el producto escalar de una función f(1) por otra función 
g(t) se define mediante la fórmula 


o= OZD at. (e) 

è 
Las propiedades de 1° a 4° se demuestran fácilmente y, por consi- 
guiente, el espacio L es unitario. En este ejemplo el campo prin- 
cipal es el cuerpo de todos los números complejos. Si nos limita- 
mos a considerar solamente las funciones continuas de valores 
reales, se puede tomar como campo principal el cuerpo de los nú- 


meros reales. La fórmula (7) quedará sustituida entonces por la 
fórmula r 


F D= f Oed. 
à 4 


17.2. Longitud de un vector. El cuadrado escalar (a, a) de 
cualquier vector es, según el axioma 4”, un número real no nega- 
tivo. El valor no negativo de la raíz cuadrada de este número se 
denomina longitud o norma del vector a y se designa por [|a/|. Es 


decir, por definición 
llall =V iaa). 


De esta definición se ve directamente que el vector nulo es el único 
vector cuya longitud es igual a cero. Además, si a es un número, 
se tiene 


laa || =V Tea, aa) = V aa {a, a) = |a | Vía, a), 8) 


es decir, al multiplicar un vector por un número su longitud se 
multiplica por el módulo de este número. Un vector cuya longitud 
es igual a la unidad se llama vector idad o vector normalizado. 
La igualdad (8) muestra que al multiplicar un vector no nulo por 
el número inverso de su longitud se obtiene un vector unidad. 
Esta operación se llama a veces normalización de un vector. 

Pasamos a la demostración de una desigualdad importante que 
relaciona las longitudes de dos vectores con el valor del producto 
escalar de los mismos. 

DESIGUALDAD DE CAUCHY-BUNIAKOVSKi. Para cualesquiera dos 
vectores a y b de un espacio unitario es válida la desigualdad 


Ha, b) i< llall- 


teniendo lugar la igualdad cuando, y sólo cuando, los vectores `a y 
b son linealmente dependientes. 
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Para cualquier número A se tiene en virtud del axioma 4° 


(a—Ab, a—1b)>0, (9) 
de donde realizando la multiplicación obtenemos 
(a, a)—X(a, b)—A (2, D) +R (b, b)>0. (10) 


Si b=0, la desigualdad requerida se cumple de un modo trivial ya 
que ambos miembros suyos resultan ser iguales a cero. Su jongamos, 
por elio, que b=%o. Tomando en la desigualdad (10) en lugar de A 


el número e y multiplicando todos los miembros de la desigual- 
dad por el número positivo (b, b), obtenemos 
(a, a)(b, b)—(a, dj(a, b)—(a, bría, b)+ (a, b)ía, E) >0, 
es decir, 
(a, b)(a, b)< (a, a) (b, b) 


Ita, I< halb. (11) 
Luego, hemos demostrado la desigualdad de Cauchy — Buniakovski. 
i a y b son linealmente independientes, se tiene a—ìbs20 
y en lugar de (9) podemos tomar la desigualdad estricta 
(a—-ìb, a—Ab) > 0. 
Pero entonces, podemos omitir en todas las desigualdades sucesivas el 
signo de igualdad y eh lugar de (11) 'oblendremos la desigualdad 
la, )]<all-11611- (12) 
En cambio, si a y b son linealmente dependientes, por ejemplo, 
a=ab, tenemos 
la, d)=|(0b, 0) ]=|a/(b, 0) =(/a/-1151). 
Luego, hemos demostrado también la observación complementaria 
a la desigualdad de Buniakovski. 


Veamos qué es lo que significa la desigualdad de Buniakovski 
en aquellos espacios concretos que hemos considerado anteriormente. 


o 


Sea £ el espacio unitario de filas. Tomemos en el mismo unos vec- 
tores a= [a ..., an] y b=[B,, ..., Ba]. Tenemos según la fór- 
mula (6) 


la, labia abad, 


lal=VT,P+--FTP y 1014=V1B,P+> Fe. 


La desigualdad de Cauchy— Buniakovski significa, por consiguiente, 
que 


A AS 
donde «a, y $; son números complejos cualesquiera. 
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Análogamente, si £ es el espacio de funciones mencionado ante- 
riormente, la desigualdad de Buniakovski se convierte en la desi- 
gualdad 

1 


; i 
joBa|<jiroraiieora 
è 


E 


Volvamos a los espacios unitarios arbitrarios. La desigualdad 
de Cauchy—Buniakovski permite ahora demostrar fácilmente la 
siguiente proposición: la longitud de una suma de vectores no sobrepasa 
la suma de las longitudes de los sumandos. Es obvio que basta con- 
siderar el caso de dos sumandos solamente, ya que el caso general 
se deduce de éste por inducción. Tenemos 

lla+b1P=(a4b, a+0)=(a, a) +(a, b)+ 
+(a, 0) +(b, b)=(a, a) +2 Re(a, 0) +(0, b), 
donde Re(a, b) es la parte real de (a, b). Puesto que 


Re(a, 0) <J(a, I< ialll 
se tiene 


la+b1P<lalP4-2)121)-11611+1161*=(Nall+/1611), 
de donde resulta . 
lla+61)<llal+11011 


que es lo que se quería demostrar. 
La expresión [|a—b|| suele llamarse a veces distancia entre los 


vectores a y b. Indicándola por p(a, b) obtenemos las relaciones 
siguientes 


1) p(a, a)=0; p(a, 6)>0, si azb; 

2) p(a, b)=p(b, a); 

3) p(a, b)+p(b, c)>p(a, c). 
ı La demostración de las mismas es evidente: por ejemplo, Ja 
última resulta de 


P (a, e) =||a—c || =||(a—b) +(b-c) [| < 
<lla—bi+ilb—cl=p(a, b)+p(b, 0). 


17.3. Sistemas ortonormales. Unos vectores a y b de un espacio 
unitario Y se llaman orfogonales si el producto escalar de a por b 
es igual a cero. Si £ es el espacio corriente, el concepto de ortogo- 
nalidad coincide con el concepto de perpendicularidad. Por esto la 
ortogonalidad puede ser considerada como una generalización del 
concepto de perpendicularidad. 

Del axioma 1” se deduce que la relación de crtogonalidad es 
simétrica: si el vector a es ortogonal a b, el vectc- b es ortogonal 
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a a. Es obvio que el vector nulo es ortogonal a cualquier vector del 
espacio y es el único vector que posee esta propiedad. 

Un sistema a,, Az, ..., a, de vectores de un espacio unitario 
se llama ortogonal si cualesquiera dos vectores a, y a, (ik) del 
mismo son ortogonales. Si el sistema contiene solamente un vector, 
también lo llamaremos ortogonal. 

TEOREMA t. Todo sistema ortogonal de vectores no nulos de un 
espacio unitario & es linealmente independiente. 

En electo, sea au A, ..., A un sistema ortogonal de vectores 
no núlos y sea 

A, +00... Onda =0. 
Multiplicando esta igualdad escalarmente por aj, obtenemos 


A (a, a) +a (an a) +-.. An (An, aj) =0 
o 


aj(a;, a) =0, (13) 


ya que debido a la ortogonalidad del sistema todos los demás tér- 
minos se anulan. Pero a; 0; por consiguiente, (a, a) 340 y de (13) 
resulta «j= 0 que es lo que se quería demostrar. 

Sea n la dimensión del espacio £. El teorema 1 muestra que 
todo sistema ortogonal de vectores no nulos de € no puede contener 
más de n vectores. Si en £ existen n vectores no nulos ortogonales, 
ellos constituyen una base ortogonal del espacio &. Probemos que 
en Y siempre existe una base de esta índole. Es más, probemos 
que en todo espacio unitario € cualquier sistema ortogonal de vecto- 
res no nulos puede ser complementado hasta obtener una base ortogonal 
del espacio &. Sea dado en Lun sistema ortogonal a,, ... .,4,. Comple- 
mentémoslo hasta obtener un sistema ortogonal maxi Bis da 
Ami» +..» 4, de vectores no nulos. Tal completación es posible, 
ya que según el teorema 1 ningún sistema ortogonal puede contener 
más de n vectores diferentes de cero. Probemos que a,, ..., Gm... 
..., a, es precisamente la base requerida del espacio £. Conside- 
remos un vector x cualquiera de £. Pongamos 


fx, ay) 
LE 1,2... 


y=% Him +... +54, 


Multiplicando escalarmente todos los términos de la última igualdad 
por ap, obtenemos 


(Y, a) =(%, a), 
de donde resulta i i 


Y, a) = (X, a) —(y, a) = 0. 
Por consiguiente, el vector x—y es ortogonal a todos los vectores 
ay ~.. a El sistema a, , 4, es, por hipótesis, un sistema 
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ortogonal maximal de vectores no nulos de &; luego, x—y=0, es 


decir, 
x=E0, +80, +... HE 


Por lo tanto, el sistema linealmente independiente a, ..., a, es 
ta] que cualquier vector x se expresa linealmente en términos del 
mismo. Pero esto significa precisamente que a,, ..., a, es una base 
del espacio Q. 

Un sistema ortogonal formado por vectores de longitud igual a 
la unidad se denomina ortonormal. Es obvio que normalizando vec- 
tores ortogonales no nulos obtenemos de nuevo vectores ortogonales. 
Por lo tanto, al normalizar los vectores de una base ortogonal del 
espacio, obtendremos una base ortonormal de este espacio. Hemos 
visto que todo sistema de vectores ortogonales no nulos puede ser 
complementado hasta obtener una base ortogonal del espacio. Por 
esto es válido el teorema siguiente. 

TEOREMA 2. Todo sistema ortonormal de vectores de un espacio Y 
puede ser complementado hasta obtener una base ortonormal de este 
espacio. 

Puesto que cualquier sistema que contiene sólo un vector es 
ortogonal, de aquí se deduce, en particular, que en todo espacio 
unitario existe una base ortonormal. 

Un sistema de vectores £,, €,, ..., €, considerados en un orden 
determinado ha sido llamado sistema de coordenadas de un espacio L, 
Si €,, +.., €, forman una base del espacio l. Si e,, ..., e, es una 
base ortonormal, también el sistema de coordenadas se denomina 
ortonormal. La diferencia que existe entre un sistema de coordenadas 
arbitrario y un sistema de coordenadas ortonormal es la misma que 
existe entre un sistema de coordenadas cartesiano oblicuo y un 
sistema ortogonal del espacio corriente. Efectivamente, sea W el 
espacio corriente de vectores:segmentos provisto del producto escalar 
habitual. Una base arbitraria del espacio Ñ está formada por tres 
vectores cualesquiera a,, a, y a, que parten de un punto O y que 
no pertenecen a un mismo plano (véase la fig. 1 de la pág. 79). 


Tomemos un punto A y expresemos el vector OA en términos de 
los vectores, coordenados a,, a, y a,. Sea 


DA=0,0,+00, +04, 


Los números %,, % y æ, son, según la definición, las coordenadas 


del vector OA. Al mismo tiempo, se ve de la figura que estos nú- 
meros son las coordenadas del punto A calculadas en el sistema de 
coordenadas cartesiano oblicuo con los ejes a,, a, y as, en el que 
los vectores a,, a, y a, se han tomado como segmentos unidades 
a lo largo de los ejes. 
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Por consiguiente, un sistema arbitrario de coordenadas en Xt 
es equivalente, desde el punto de vista de la Geometria analitica, 
a un sistema de coordenadas cartesiano oblicuo con distintas uni- 
dades a lo largo de los ejes coordenados. Por el contrario, un sistema 
ortonormal de coordenadas e,, e, y €, será ä A 
equivalente, en este sentido, al sistema de le 
coordenadas cartesiano ortogonal habitual 
con unidades iguales sobre los ejes 
(fig. 4). 

Los sistemas ortonormales de coordena- 
das de los espacios unitarios tienen varias g 
propiedades específicas. Algunas de éstas e, 
serán consideradas ahora. É 

Si €, en ..., €, es un sistema ortonor- E + 
mal de coordenadas de un espacio Ẹ, las Fig. 4. 
coordenadas de un vector cualquiera a son p” 
iguales Ape omente a los productos escalares (a, e,), (a, e), 
seer (0, Cn). 

En efecto, sea 

a=, Hae, H eo 
Multiplicando esta igualdad escalarmente por e, y teniendo en cuenta 
que (€, e,)=0 para ik, obtenemos 
(a, ex) =A (Cn 0) =% (R=1,2,...,1) 
que es lo que quería demostrar. 
Si en un sistema de coordenadas ortonormal los vectores a y b tienen 


respectivamente las coordenadas %;, Qp -=0, On Y Bar Bar +-+» Bue Se 
tiene 


(a,0)=0B +aB,+..- +0. (14) 


Efectivamente, sea e,, e, 


-4 £n Un sistema de coordenadas orto- 
normal dado y sea 


a= ae, Hat... Hen 
b= Bie, + Baest o- H Baen 


Entonces, 
(a,0)=(Hag, Dhed =P le e) = Zap, 
DESIGUALDAD DE BESSEL. Si €,,€,, ..., €p es un sistema ortonor- 


mal cualquiera de vectores de un espacio unitario y a es'un vector 
arbitrario del mismo y si tomamos + 


Geaa (k=1,2,..., m), 
tiene lugar la desigualdad 
(00>la Pela Pe... +10m 


14—1843 
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Daremos una demostración independiente de esta igualdad, aun- 
que la misma se puede deducir fácilmente de las proposiciones an- 
teriores. Consideremos un vector auxiliar 


A 


Tenemos 
(a—x, a—x)=(a, a)—(a, x)—(x, a) + (x, x) > 0, (15) 
w a= Rae Dae)= Daa, (16) 
(a, x) (a, Lac) =D 0%) (17) 


(x, a) =Q, 1) = Daa. (18) 
Introduciendo (16), (17) y (18) en la desigualdad (15) obtenemos 
(a, )—Zag — Dai + Baa 0, 


(a, a) > Daa; 
que es lo que se quería demostrar. 


Si €,, € »»., €, es una base ortonormal. en lugar de la desigual- 
dad de Bessel tendremos, según (14), la igualdad 


(a, 0) = am 404% 4 > + > + Anin 
que se llama igualdad de Parseval. La igualdad de Parseval, ade- 
más de ser una condición necesaria, es también una condición sufi- 
ciente para que un sistema e,, €,, ..., €, ortonormal sea una base. 
Si y, €s, --., €, es un sistema ortonormal de vectores de un es- 
pacio & y si para todo vector a de & se tiene » 


(a, a) = a, +02) +... A Anan 


donde aj=(a, e), j=1,2,..., n, entonces el sistema €,, 6p,- ., ên 
es una base del espacio 


La demostración se deduce fácilmente de las proposiciones ante- 
riores y queda a cargo del lector. ® 


Hemos demostrado la existencia de una base ortonormal en todo espacio 
unitario mediante razonamientos indirectos. No obstante, existe un método 
directo que permite obtener a partir de cualquier base de un espacio una base 
ortonormal del mismo. Este método lleva el nombre de proceso de orfonormall- 
zación de Gram— Schmidt y se emplea con frecuencia al considerar los espacios 
de funciones, Su esencia consiste en lo siguiente. Sea ar .... am un sistema 
linealmente independiente de vectores de un espacio unitario Ẹ. Planteémonos la 
tarea de construir un sistema ortonormal de vectores e1, ea, ...., €m tal que todo 
vector j-ésimo ey del mismo se exprese linealmente en términos de los j prime- 
tos vectores ay, ..., ay. Realizaremos lá construcción por inducción. El vector e, 
debe expresarse, según lo convenido, en términos de a, y debe ser de longitud 1. 
Un vector así se obtiene normalizando ay: 


es decir, 
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Supongamos ahora que ya han sido construidos los vectores es, ..., ey con 
Jas propiedades requeridas correspondientes a un valor de j. Busquemos eyer. 
Ante todo, escojamos unos números y, ..., ay de modo que el vector auxiliar 


an a ae... aye, (19) 


sea ortogonal a los vectores es, ez 


, ez. Multiplicando (19) escalarmente por ep 
(k=1,2, ..., J) veremos que para 


lo és necesario que 


Am (aj ti, e). (20) 


Reciprocamente, tomando para æy los valores de (20) e introduciéndolos en (19), 
obtenemos un vector e, ortogonal a er, €s, .... €y. Puesto que a+r no puede 
expresarse linealmente en términos de a, aj y, por consiguiente, no puede 
ser combinación lineal de los vectores ej, -.., ey, resulta que ej, es diferente 
de cero y, por lo tanto, puede ser normalizado. Tomemos 


1 
ler 


Las relaciones (21) y (19) muestran que e,+1 se expresa linealmente en términos 
de ai, ap, .--, a/+1. Además, e, está normalizado y es ortogonal a todos los 
vectores "en ..., €). Por consiguiente, se cumplen. les” suposiciones de Inducción 
y podemos considerar que la sucesión €y, es, -.., em ha sido construida. Si 19 
sucesión inicial ax, oq, -u Am era una base del espacio, es obvio suce- 
sión e1, en...» em obtenida mediante el proceso de ortonormalización también 
será una base del” espacio £. 


e. fos (21) 


17.4. Isomorfismo. En el p. 4.3 hemos quedado en llamar iso- 
morfos dos espacios Tineales si entre los elementos de los mismos se 
puede establecer una correspondencia biyectiva que conserva las 
operaciones de adición y de multiplicación por número, En los es- 
pacios unitarios a estas operaciones se agrega además la de multi- 
plicación escalar. Por esto resulta natural llamar isomorfos los 
espacios unitarios sólo en el caso en el que ellos se comportan 
idénticamente respecto a las tres operaciones mencionadas. 

DEFINICIÓN. Dos espacios unitarios £ y £, sobre un mismo campo 
de coeficientes se llaman isomorfos, si entre sus elementos se puede 
establecer una correspondencia biyectiva en la que la suma de dos 
vectores de & se transforma en la suma de los vectores correspondien- 
tes de L,, el producto de un número por un vector de & se transforma 
en el producto del mismo número por el vector correspondiente de €, 
y los productos escalares de pares correspondientes de vectores de g. 
y de &, coinciden. 

Tendrán interés para nosotros sólo aquellas propiedades de los 
espacios unitarios que sean propiedades de las tres operaciones prin- 
cipales definidas en estos espacios y que no dependan de la natura- 
leza de los elementos que constituyen los espacios. Desde este punto 
de vista los espacios unitarios isomorfos tendrán las mismas propie- 
dades. De aquí se ve la importancia de saber clasificar, salvo un 
isomorfismo, todos los espacios unitarios. Esta clasificación no difiere 


14* 
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en nada de la clasificación de los espacios lineales y queda determi- 
nada por el teorema siguiente. 

TEOREMA 3. Para que dos espacios unitarios sobre un mismo campo 
de coeficientes sean isomorfos es necesario y suficiente que coincidan 
las dimensiones de estos espacios. 

En efecto, si dos espacios unitarios y L, son isomorfos, tam- 
bién serán isomoríos como espacios lineales, es decir, respecto a las 
operaciones de adición y de multiplicación por número. Pero los 
espacios lineales isomoríos son de la misma dimensión y, por con- 
siguiente, las dimensiones de ios espacios y €, coinciden. Hemos 
demostrado la necesidad. Recíprocamente, supongamos que las dimen- 
siones de los espacios Y y £, coinciden. Tomemos en $ y €, unas 
bases ortonormales e, €n Y ei, =>, €. Diremos que los vecto- 
res xXEL y x EQ, son correspondientes si sus coordenadas en las 
bases escogidas coinciden. Esta correspondencia es biyectiva y con- 
serva las operaciones de adición y de multiplicación por número 
(p: 43). Por ello sólo debemos probar que los productos escalares 
le los pares correspondientes de vectores son idénticos. Considere- 
mos dos vectores cualesquiera 


E E 
be Bie, + Paea + + Ben 

del espacio . Los vectores correspondientes de Q, son 
a = ae Hae as 
=P t Biei + -o + Baen 


Puesto que las bases e,, ..., €, Y £í, .., €, son ortonormales, tene- 
mos en virtud de la fórmula (14) 


(a, b)= a,b +0 B,+-... +0,B,=(0', 6) 
que es lo que se quería demostrar. 


17.5. Sumas ortogonales Proyecciones. Dos conjuntos de vecto- 
res WE y N de un espacio unitario E se llaman ortogonales, si todo 
vector del primer conjunto es ortogonal a todo vector del segundo. 
En particular, se dice que el vector a es ortogonal al conjunto D, 
si a es ortogonal a todo vector de M. A veces, la ortogonalidad de 
D y N se indica simbólicamente por M | N. 

Si dos conjuntos M y N son ortogonales, la intersección de los mis- 
mos o bien es vacía, o bien consta del vector nulo únicamente. 

En efecto, si el vector a está contenido en M y en M, se tiene 
(a, a)=0, de donde a=0. 

Una suma A,-+... + Y, de varios subespacios lineales se llama 
ortogonal si cualesquiera dos subespacios A, y A, (¡=+k) son orto- 
gonales. 
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Una suma ortogonal de subespacios es siempre una suma directa. 
Efectivamente, si la suma es sólo de dos sumandos, la intersec- 
ción de los mismos, en virtud de la observación anterior, consta 
solamente del vector nulo y, por consiguiente, la suma es directa, 
En el caso general, la demostración se realiza por inducción. 
Si la suma 
AA +. +, 
es ortogonal y si 
0=0,+0,+...+0p 
b=bit+bi t. -tbs 


donde a,€ Y, y bjEAp j=1, ..., $, se tiene 
(a, b)= (0, b)+ (ay b) t- + (ar dp). (22) 


En efecto, puesto que A, | A, para j +k, resulta que (a, ba) =0. 
Por consiguiente, 


(a, b)=(2a;, Yo) =D (2, b= Zla, b) 
que es lo que se queria demostrar. 

Consideremos ahora un conjunto no vacio cualquiera W de vec- 
tores de un espacio unitario Y. El conjunto de todos los vectores 
del espacio Y ortogonales a Yt se llama complemento ortogonal 
del conjunto M y se indica por Mt. 

El complemento ortogonal de un conjunto no vacío cualquiera M 
es un subespacio lineal. 

En efecto, si a y b pertenecen al complemento ortogonal Wt y 
c es un vector cualquiera de M, se tiene 

(aa + Bb, c)=a(a, c)+B(b, c)=0. 
Por consiguiente, cualesquiera que sean a y P el vector aa+ Bb 
está contenido en ML y Mi en subespacio lineal. 

TEOREMA 4. Todo espacio unitario £ es la suma directa de cual- 
quier subespacio lineal suyo XÑ y de su complemento ortogonal A+, 

Sea €,, er », €m Una base ortonormal del subespacio A y sea 
ensi» :-:, e, una base ortonormal del subespacio AL. Para demos- 
trar el teorema es suficiente ver que e, la , €, es una 
base del espacio £. Supongamos, por el contrario, que el sistema 
ep «»., €, no es una base del espacio €. Entonces, de acuerdo con 
el teorema 2, este sistema puede ser complementado hasta obtener 
una base ortonormal del espacio Q. Sea e uno de los vectores 
complementarios. Puesto que e es ortogonal a todos los vectores 
€ »».» En, el vector e está contenido en A4. Por consiguiente, 
A- contiene un sistema ortonormal y, por ende, linealmente inde- 
pendiente de vectores £,¡, ---, En, €. Pero esto contradice a nuestra 
hipótesis de que en, 
trado el teorema. 


~» €, es una base de A+. Hemos demos- 
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Del teorema 4 se desprende, en particular, que 
NLL=A. (23) 


Efectivamente, Att está contenido indudablemente en AL. Por otra 
parte, según el teorema 4, para cualquier x de ALL tenemos 


x=a+b, acA y beL. 


Multiplicando escalarmente esta igualdad por b, obtenemos (b, b) =0, 
es decir, b==0 y x=a. Luego, Ait =Y. 

,Definemos, para concluir, el concepto de proyección ortogonal 
de un vector sobre un subespacio lineal. Sea Y un subespacio 
lineal de un espacio unitario *. En virtud del teorema 4, Q es la 
suma directa del subespacio X y de su complemento ortogonal AL, 
Por consiguiente, todo vector x de L puede ser representado 
univocamente en forma de una suma 


x=a+b (aù y bEAL). (24) 


El sumando a se llama proyección del vector x sobre el subespacio A. 
Puesto q de acuerdo con la fórmula (23) A es el complemento: 
ortogonal de AL, el sumando b de la igualdad (24) representa la 
proyección del vector x sobre el subespacio At. 

Multiplicando (24) por un número æ, obtenemos 


ax=aa+ab (0ME% y abei), 


es decir, la proyección del producto de un número por un vector es 
igual al producto de este número por la proyección del vector. 
Análogamente se demuestra también la proposición de que 
la proyección de una suma de vectores sobre un subespacio es igual 
a la suma de las proyecciones de los sumandos sobre este subespacio. 


Ejemplos y problemas 
L. Sea ey, ez y es un sistema ortonormal de coordenadas de un espacio 
unitario de tres dimensiones. Pruébese que el sistema de vectores 
a=3 0 +20— es, 
a e at 
1 
03m (e — 2e, + 2e) 


también constituye un sistema ortonormal de coordenadas de este espacio. 

2. En un espacio unitario € se ha tomado un sistema ortonormal, de coor- 
denadas er, -.., ên: Pruébese que un sistema de vectores ay, ..., dn será también 
una base ortonormal del espacio € cuando, y sólo cuando, la matriz formada 
por las filas coordenadas de estos vectores sea unitaria (véase ef p. 1.3) 
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3. Si ay, -.., Gm' es una base ortonormal de un subespacio lineal U, la 
proyección de un vector x sobre Y es igual a 


(5 aya pls a) azt... Hl, am) am 


4. En el espacio de todos los polinomios en À de grado no mayor que n el 
producto escalar se define mediante la fórmula (7) del p. 17.1, Pruébese que éste 
será un espacio unitario de dimensión n-+1. Pruébese que ortonormalizando 
según Gram-—Schmidt en este espacio la sucesión 1, A y À? obtenemos los 
polinomios 1, V3 (2—1) y V5 (6A%—64+1). 

5. Se llama determinante de Gram de un sistema de vectores ay, ag, . 
de un espacio unitario € de a dimensiones el determinante 


(an, a) (ar, 25) ... (01, an) j 
(as, a1) (as, as) (az, ân) 


(Em a1) (an, 0) <.: (an and 


Supongamos que en Q se ha escogido un sistema ortonormal de coordenadas 
Prúébese que el determinante de Gram A es igual al cuadrado del módulo del 
determinante formado por las filas coordenadas de los vectores ay, ..., an. 
Pruébese también que au dz, -... an son linealmente independientes cuando, 
y sólo cuando, el determinante de Gram de los mismos sea diferente de cero 

6. Dése una interpretación geométrica al proceso de ortonormalización de 
Gram=-Schmidt en el caso del espacio habitual de tres dimensiones de los 
vectores-segmentos. 


an 
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18. 1. Funciones lineales. Sea @ un espacio lineal cualquiera 
de dimensión finita sobre un campo K. Pongamos en correspondencia 
a todo vector x de un número f(x) de K. Las correspondencias 
de este tipo han sido llamadas en el p. 4.1 funciones con valores 
en K definidas sobre £. Una función f(x) se llama lineal si para 
cualesquiera x e y de y cualesquiera œ y B de K se tiene 


Flax + By) = af (x) + BF (9). (1 
Tomando en (1) a=P$=0, obtenemos 
Fo) =0. 


Por esta razón en lugar de «función lineal» se dice a veces «función 
lineal homogénea». 

Es fácil ver que la suma de funciones lineales y el producto de 
un número por una función lineal son de nuevo funciones lineales. 
Probemos, por ejemplo, la primera proposición. Sea f[=g+h, 
donde g y h son funciones lineales. De acuerdo con la definición 


Hox+ By) =g (ax + Py) +A (ax+ By) = 
=08 (x) + Bg (y) + ah (x) + BA (y) =0f (x) + BF W) 
que es lo que se quería demostrar, 
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Conocemos ya que las operaciones de adición de funciones y de 
multiplicación de las mismas por números satisfacen los axiomas 
de un espacio lineal. Puesto que la suma de funciones lineales y 
el producto de una función lineal por un número son de nuevo 
funciones lineales, resulta que el conjunto de todas las funciones 
lineales, definidas sobre un espacio vectorial L, es por si mismo 
un espacio lineal. Este espacio se llama espacio conjugado (o dual) 
respecto a Y y se indica por Y. 

De la igualdad (1) que caracteriza las funciones lineales se 
desprende inmediatamente una relación más general 


Fatit arat- E) =a (X) + f (a) + +++ + Ob a) (2) 


cuya demostración omitimos ya que es obvia. Los teoremas que 
siguen esclarecen en gran medida la estructura de las funciones 
lineales. 

TEOREMA 1. Sea €, en . e, un sistema de coordenadas cual- 
quiera de un esposo lineal $. Tomemos una sucesión totalmente 
arbitraria œ, +=», Œn de números de K. Entonces existe una 
función lineal Fo, y "sólo una, que está definida sobre % y que 
satisface las condiciones 


[e)=a, ((=1,2,..., n). (8) 
DEMOSTRACIÓN. Sea x un vector de L: 
=h + Esta o Eo 4) 


Poniendo en correspondencia a este vector el número o, 
tatata . tann obtenemos una función f(x) sobre L. Es er, 
n 


por del 
F) =b, aat o o H Aaa 
Tomando aqui x=e, tendremos f(e) =a; (¡=1, ..., n). Por otra 
parte, si 
Y Med Ne H Mi (5) 


tenemos 
FU) SaN, Ha H -o H Aaa 
De (4) y de (5) se deduce que 
ax + By = (af, +B) e +- - - + (AEn BN) en 
de donde Ñ 
Flax + By) = a, (a$, HBN) + - - - +0, (25, + Bn.) = af (x) + BF (9). 


Por consiguiente, f(x) es una función lineal. 

Hemos demostrado que existe una función lineal que satisface 
las condiciones (3). Probemos que es única. Sea g(x) una función 
lineal tal que g(e)=a, (=1, ---, n). Entonces para un vector 
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cualquiera x de coordenadas Ẹ,, ..., E, tenaremos 


E) =8 Ge H -o o HEren) =g le) >> +58 (0) == 
ahat. +E an 
es decir, g (x) =f (x). 

El teorema 1 ha sido demostrado para espacios lineales £ cua- 
lesquiera. Si el espacio £ es unitario, las funciones lineales sobre € 
tienen una expresión muy sencilla en términos del producto escalar. 

TEOREMA 2. El producto escalar (x, a) de vectores de un espacio 
unitario £ es una función lineal de x siendo a fijo. Con ello a todo 
vector a de 2 se pone en correspondencia una función lineal definida 
sobre Q. Además, para distintos vectores se obtienen distintas 
funciones lineales y todas las funciones lineales sobre & pueden ser 
construidas por este procedimiento. 

La primera afirmación es evidente, ya gue de f(x)=(x, a) se 
deduce que 


Í (ax + By) = (ax + By, a) =a (x, a) +B (y, a) =af (x) + Bf (y). 


Demostremos la segunda afirmación. Supongamos que, al contrario, 
a diferentes vectores a y b corresponde una misma función lineal; 
entonces esto significa que la igualdad (x, a)= (x, b) tiene lugar 
para cualesquiera vectores x de Y. Pasando los términos a un mismo 
miembro, podemos representarla en la forma (x,a—b)=0, de donde 
tomando x=a—b obtenemos (a—b, a—b) Pero el vector nulo 
es el único vector cuyo cuadrado escalar es igual a cero, es decir 
a—b=0 o a=b. Resta demostrar la tercera afirmación, esto es, 
que toda función lineal f(x) definida sobre & puede ser representada 
en la forma 


(x)= (x, a), (6) 


donde a depende de f y x es un vector arbitrario de £. Indiquemos 

or A el ata de todos los vectores para los cuales f (x) =0. 
uesto que F(o)=0, el vector o indudablemente pertenece a A. 
Además, si los vectores a y b pertenecen a A, se tiene 


Faa+Bo)=af (a) + Bf (6) 0, 
es decir, también aa-+Bb pertenece a A. Por consiguiente, A es un 
subespacio lineal del espacio £. Si A=2, resulta que f (x)=0 para 
todos los vectores x. Para satisfacer la condición KG es suficiente 
tomar en este caso a=0. Supongamos por ello que N€, Tomemos 
un vector no nulo b cualquiera de que sea ortogonal a A y tra- 
temos de determinar un número æ tal que el vector a=ab satisfaga 


la relación (6). Sea F(b)=fP y sea f(x)=E, donde x es un vector 
cualquiera de L, Tenemos 


$0) 0 $100. 
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Indicando por c la diferencia x—Ẹb, veremos que c pertenece a A 
y que x=c+$b. De aqui resulta 
w a=($ b+c, 0)= Ep, )+2 (0, b). 


Puesto que el vector b es ortogonal a Y, tenemos (c, 5)=0 y, por 
consiguiente, 


w a=È o, b). m 
La igualdad (7) muestra que siendo a=B(b, b)-> se tiene para 
cualquier x 

(0) =8=/(x) 
que es lo que se quería demostrar. 

18.2. Aplicaciones conjugadas. Emplearemos ahora los resultados 
del punto anterior con el fin de obtener para toda aplicación lineal 
de un espacio unitario una aplicación nueva univocamente deter- 
minada y llamada conjugada de la dada. 


Sea 4 una aplicación lineal de un espacio unitario £. Tomemos 
en £ un vector arbitrario y y consideremos la expresión 


F= lA, y), (8) 
donde x es un vector variable. Puesto que 
Flau + Bu) + (ou + Bo) 4, y) = (a-u +B-04, y) = af (u) + Bf (0), 


f(x) es una función lineal. Por esto f(x) puede ser representada, 
de acuerdo con el teorema 2, en la forma 


F(x)= (x, a), (9) 


donde el vector a queda determinado univocamente por la función 
f(x), es decir, por “la aplicación Æ y por el vector y. Si considera- 
mos A como una aplicación dada y hacemos variar el vector y, 
tendremos entonces para todo vector y un vector determinado a. La 
aplicación que transforma y en a se indica por 4* y se llama con- 
jugada de 4; es decir, a=yA*. Introduciendo este resultado en (9) 
y comparando con (8) obtenemos la relación 


(xd, y) = (x, yA?) (10) 
que tiene lugar para cualesquiera vectores x e y de Q. 
La propiedad (10) caracteriza plenamente la aplicación conju- 


gada 4*. En efecto, sea 3 una aplicación con la misma propiedad, 
es decir, que para cualesquiera x e y 


AA, y) = a, yB) 
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(x, yA) (2, YB) =(x, yA" — yB) =0. 
Esto significa que el vector yA*—y3 es ortogonal a todo el espa- 
cio, de donde resulta que 
yA*=yR. 
La última igualdad tiene lugar para todos los y y, por consiguiente, 
=P. 


Es fácil demostrar ahora que la aplicación conjugada .A* es li- 
neal. Efectivamente, en virtud de (10) se tiene 


(x, (au + Bo) A= At, au Bo) ar, u) +Ë (x4, 0) = 
=a (x, ud) +P (x, 04") = (x, a-u A’ B ot’) 
cualquiera que sea el vector x. Debido a la segunda afirmación del 
teorema 2 esto implica la igualdad 
` (au + Bo) A =a ut’ Hp vA" 


que significa precisamente que .4* es lineal. 

La operación de paso a la aplicación conjugada posee las pro- 
piedades siguientes: . 

a) (Y=, 

bD) (Af =at 

c) (d+ BN =A +D, 

d) (ABP =B. 

Todas estas propiedades se demuestran de un mismo modo y por 
ello nos limitaremos a demostrar sólo una de ellas. 

Por ejemplo, 

(XAB, y) = (xA, y5) 

es decir, (AB) = BA”. 

Notemos aquí mismo que las aplicaciones conjugadas de las apli- 


caciones identidad y nula coinciden con ellas mismas. Efectiva- 
mente, 


(e, y) =(x, y)=(x, y8) Y (10, y) =0=(x, yO). 

Veamos la relación que existe entre las matrices de las aplica- 
ciones conjugadas. Tomemos en el espacio Y un sistema ortonormal 
de coordenadas €, ês, ---, €, Y Sea 

EA = Anly hat. + nta 
el = Bae, Bilat + Bina =EN, -.., 1). 


(e, YRA), 
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Multiplicando estas igualdades escalarmente por e, y teniendo en 
cuenta que el sistema e,, ..., e, es ortogonal, obtenemos 


lat ep=04y y e e)=by (dol. 
De aquí resulta que 

ay= (eA, e) = (en eA) =A e) = By 
Por consiguiente, si A es la matriz de la aplicación 4, la matriz 
de la aplicación conjugada 4* será igual a A”. Hemos obtenido el 
siguiente teorema. 

TEOREMA 3, Si una aplicación lineal A tiene en un sistema orto- 
normal de coordenadas la matriz A, la aplicación conjugada A* tendrá 
en este mismo sistema la matriz conjugada transpuesta A". 

La operación del paso a las aplicaciones conjugadas posee las 
propiedades a), b), c) y d). En base al teorema 3 deducimos de 
aquí que estas mismas propiedades posee también la operación del 


paso a las matrices conjugadas transpuestas. Este resultado se ob- 
tiene también mediante cálculo directo (compárese con el p. 1.3). 


18.3, Aplicaciones normales. Una serie de propiedades notables 
pueden ser obtenidas en el caso de las aplicaciones lineales de un 
espacio unitario que conmutan con sus- conjugadas, es decir, que 
satisfacen la relación 

AAA 


Estas aplicaciones se llaman normales. Recordando que en un sistema 
ortonormal de coordenadas las aplicaciones conjugadas tienen ma- 
trices conjugadas transpuestas, llegamos directamente a la conclusión 
de que son normales aquellas aplicaciones lineales de un espacio 
unitario, y sólo aquéllas, cuyas matrices, calculadas en unas bases 
ortonormales, satisfacen la relación 


ARA. 

Con la misma facilidad se obtienen también las siguientes pro- 
piedades de las aplicaciones normales. 

TEOREMA 4. Todo vector propio a de una aplicación normal A 
correspondiente a un valor propio p es al mismo tiempo un vector 
propio de la aplicación conjugada A* pero correspondiente al valor 
propio conjugado de p. 

Tenemos 


AANA y a(d—p8)=0. 

De aquí resulta à 
o= (a(4—p8),a (4—p8)) =(2(4—P8)(4*—P6), a) = 
=(a(4*— pE) (4 —p8), a)=(a (4°—PE), a(d'—06), 
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es decir 
a(t*—p6)=0 
que es lo que se quería demostrar. 


TEOREMA 5, Los vectores propios correspondientes a diferentes va- 
lores propios de una aplicación normal A son ortogonales. 
Sea 


at=pa y bA=0b (p40). 
Entonces 
p (a, b)= (a4, b) = (a, b4*)=0 (a, b), 
es decir, 
(p—o)(a,b)=0 y (a, b)=0. 

Algo más compleja es la demostración del siguiente teorema 
principal. 

TEOREMA 6. Para toda aplicación normal A de un espacio unita- 
rio complejo existe una base ortonormal formada por los vectores pro- 


pios de la aplicación A; la matriz de A es de forma diagonal en 
esta base. 


Para la demostración tomamos en el espacio inicial L un vector 
propio cualquiera a,0 de la aplicación 4 e indicamos por Ñ, el 
subespacio ortogonal a a,. Si 


ad=pa y XEL, 
se tiene 


(an, x4) =(Q,l*, x)= P, (a, x)=0, 


es decir, el subespacio £, es invariante respecto de 4. De la inva- 
riancia de £, se deduce que en él existe un vector propio a, de la 
aplicación 4. Indiquemos por £, el subespacio formado por todos 
los vectores de £ ortogonales a a, y pongamos £=%,N£,. Puesto 
que £, y £, son invariantes respecto de 4, también será invariante 
el espacio £;, en el cual debe existir, por consiguiente, un vector 
propio no nulo a, de la aplicación 4. Indicando por £, el conjunto 
de todos los vectores de £ ortogonales a a, y tomando &; = &, N £, N L,, 
obtenemos un subespacio invariante de vectores ortogonales a a,, a, 
y y. Continuando el proceso encontraremos la base ortogonal re- 
querida a, a, ..., a, del espacio £ formada por los vectores 
propios de la aplicación 4. 

La propiedad de las aplicaciones normales de los espacios com- 
plejos establecida en el teorema 6 es característica para estas apli- 
caciones. Efectivamente, si la matriz A de una aplicación 4 es 
diagonal en una base ortonormal, la matriz A” de la aplicación 


conjugada también será diagonal y, por consiguiente, conmutará 
con A. 
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En los espacios unitarios reales la situación es algo diferente. 
Para analizarla demostremos primero una proposición general rela- 
cionada con unas aplicaciones reales lineales cualesquiera. 

TEOREMA 7. Toda aplicación lineal A de un espacio real no nulo 
tiene por lo menos un subespacio invariante de dimensión 1 o 2. 

Si el polinomio característico p(A) de la aplicación 4 tiene una 
raíz real a, la aplicación Z tiene en £ un vector propio no nulo. 
El subespacio tendido sobre este vector será el subespacio invariante 
requerido de una dimensión. 

Supongamos ahora que q (A) no tiene raíces reales. En este caso p (À) 
tendrá un par de raíces conjugadas a=pxio y n= ie, 
ya que los coeficientes del polinomio e (à) son reales, Tomemos en $ 
ùn sistema de coordenadas e,, e, e, y sea A la matriz de la 
aplicación «4 en este sistema. Consideremos la ecuación 


[Bn En ++» En] Aa 05, E, E), an 


donde E,, È, ..., E, son unas incóg itas cuyos valores determina- 
remos en el cuerpo de los números complejos, La ecuación (11) puede 
ser representada en la forma 


lo En -+o En] (QE —A)=0, 


donde E es la matriz unidad y O es la fila nula, Esta ecuación 
equivale a un sistema de ecuaciones lineales homogéneas respecto a 
las incógnitas $, ...,E, de matriz (aE— Ay (compárese con el 
p. 11.4). Puesto que el determinante de esta matriz es p(a) y, por 
consiguiente, es igua) a cero, la ecuación (11) tiene en el cuerpo 
de los números complejos una solución no nula que indicaremos por 
las mismas letras E,, ..., Es. Tomemos para abreviar 


[En En ++ E] =% 


de modo que la relación (11) se convierte en 


xA=ax. (12) 
Pasando aquí a los números complejos conjugados, obtenemos x Á=ú X. 
Pero los elementos de la matriz A son reales y, por lo tanto, A=A y 

XA=0x. (13) 


Puesto que las filas x+ X e ¿(x—x) son reales, en el espacio € existen 
unos vectores a y b, cuyas filas coordenadas serán iguales respecti- 
vamente a > 


la) =3 045, i 


LI=30—2. 
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Expresando aquí x y x en términos de [a] y [b] y empleando (12) 
y (13), llegamos a las relaciones 


plázelreb] (ao +0. 
Estas relaciones equivalen a las igualdades 


at rr 
bA =04 + pb 


que muestran que el subespacio tendido sobre los vectores a y bes 
invariante respecto a la aplicación 4. Hemos demostrado el teorema. 

Supongamos ahora que el espacio considerado Y es un espacio 
unitario real y que 4 es una aplicación normal del mismo, cuyo 
polinomio, característico p(A) tiene dos raíces conjugadas p+ io y 
p—io (o0). Tomando para el sistema de coordenadas €,, ..., €, 
de £ una base ortonormal cualquiera y repitiendo el razonamiento 
anterior, obtendremos de nuevo en @ unos vectores a y b 
ligados por las relaciones (15). Probemos que los vectores a y b 
serán ahora ortogonales. En efecto, para determinar estos vectores 
hemos tenido que considerar el espacio de filas Č sobre el cuerpo de 
los números somplejos. Podemos aceptar que este espacio de filas 
es unitario, tomando, de acuerdo con el p. 17.1, para el producto 
escalar de las filas [E,, ..., En] Y [Ms -+ -> Mn] la expresión Ẹmi... 
++: +a. Las filas [e,], ..., [e,] forman una base ortonormal 
de. La aplicación consistente en la multiplicación de las filas por 
una matriz A será una aplicación lineal y su matriz coincidirá con A 
en la base señalada. Puesto que A=A, la aplicación considerada 
será normal y las filas x y x, determinadas durante la demostración 
del teorema 7, serán unos vectores propios correspondientes a dife- 
rentes valores propios p+-i0 y p—io. En virtud del teorema 5 
tenemos (x, x)=0, de donde 


(15) 


(lal, b= e+, x-3=0, 


es decir, (a, b)=0. Tomando para x un vector de longitud VŽ, ob- 
tendremos de (14) que a y b serán de longitud 1. 

Demostremos además que el subespacio de £ ortogonal a a y b 
será invariante respecto de 4. En el espacio de filas Ẹ el subespa- 
cio ortogonal a [a] y [b] coincide con el subespacio Ẹ, ortogonal a 
x y Y. Este último subespacio es invariante respecto de 4, ya que 
es la intersección de subespacios ortogonales a los vectores propios 
x y x de una aplicación normal. Sea ahora y€ y (a, y)=(b, y)=0; 
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entonces [y] €2, e [y] AEÈ,, de donde resulta 
(yA, a)=([y] A, [a])=0 y (y, b)=0 
que es lo que se quería demostrar. 


La aplicación 4, inducida por la aplicación 4 en el espacio de 
dos dimensiones tendido sobre los vectores a y b tiene, en virtud 


de (15), la matriz 
p—o 
Apn ls el: 


Tomando para el número complejo p+-¿a la expresión r (cos p—i sen q), 
podemos representar la matriz A, en la forma 
coso seng 
[25m 
Por consiguiente, 4, es el producto de la aplicación de matriz rE 
r coso seng s 

y de la aplicación de matriz | Sen ọ cosp |+ La primera es una 
aplicación de semejanza de centro en el origen de coordenadas y de 
coeficiente de dilatación igual a r y la segunda representa, como 
puede verse fácilmente, un giro de ángulo q de los vectores alrededor 
del origen de coordenadas en el plano determinado por a y b. 

TEOREMA 8. Para toda aplicación normal A de un espacio real 
unitario & existe en % una ortonormal en la que la matriz de 
la aplicación A tiene la forma 


EN 3 


al i cosg, seng) 4.: 
A tiag el 
ar 
COS Pa SEN Pa 
+: Tm | — Sen Qu rt | 


donde los números k y m pueden ser iguales a cero. 

La demostración es casi idéntica a la demsotración del teorema 
análogo 6. La diferencia estriba sólo en que no podemos afirmar 
ahora que todo subespacio &; invariante respecto de 4 contiene un 
vector propio no nulo a;., de la aplicación 4.' Pero si %; no con- 
tiene vectores propios de la aplicación 4, en £% existe, en virtud 
del teorema 7, un par de vectores reciprocamente ortogonales a¡,, 
y bis, ligados por relaciones de tipo (15). Para el subespacio L;,y 
se puede tomar entonces el conjunto de vectores de £ ortogonales 
a a, Y bre De las observaciones hechas anteriormente resulta 
que 4,,, será invariante respecto de 4 y el proceso se puede con- 
tinuar después según el esquema expuesto en la demostración del 
teorema 6. Así obtendremos una base ortonormal de € compuesta 


(16) 
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por los vectores a, ..., Gr Gps Drem >>» Grem Drrm ligados 
por relaciones de tipo 


ajt=aa) (p=1, ..., k), 


agl =p 0,0, i f 
PE A (=l, ..., m, 0% 0); 


estas últimas muestran que la matriz de la aplicación 4 tendrá 
en la base señalada precisamente la forma (16). 


Ejemplos y problemas 


t. Tomemos en el espacio euclídeo corriente de tres dimensiones R una 
recta orientada que pasa por el origen de coordenadas e indiquemos por f (x) 
la longitud de la proyección del vector x sobre esta recta tomada con el signo 
correspondiente. Pruébese que f(x) es una función lineal y que toda función 
lineal sobre el espacio N es de la forma af (x), donde a ==0 y el eje de proyec- 
ción se ha escogido convenientemente (compárese con el teorema 2). 

2. Una función f(x) definida sobre un espacio lineal complejo se llama 
antilineal, si [ct 9109-41 (9) y F(ax)=3] (x). Pruébese que toda función 
antilineal' sobre un espacio unitario es de la forma (a, x). 

3. Demuéstrese que la correspondencia establecida en el problema anterior 
entre los vectores de un espacio unitario Y y las funciones antilineales es un 
isomorfismo entre Q y el espacio de todas las funciones antilineales sobre Y. 

4. En un espacio Unitario € con una base no ortonormal ay, a, y a, están 
dadas dos aplicaciones lineales A y B de matrices 


10 0 1 2-2 
A=|-12 0| y8=| 2-1 of. 
02—1 2 100 

Hállese una base orfonormal de R, si se sabe que Z y B son normales 
y que el vector a, es de longitud 1. 

5. Pruébese que sobre un espacio unitario complejo se puede extraer la 
raíz de cualquier grado natural m de toda aplicación normal, es decir, que para 
toda aplicación normal Æ existe una aplicación B, también normal, tal que 
BMA. ¿Cuál es el número máximo de estas aplicaciones 

6. Deimuéstrese que siendo Y un subespacio invariante de una aplicación 
normal 4, el complemento ortogonal AL también será invariante respecto de A. 
Si el espacio principal es complejo, la propiedad indicada caracteriza las apli- 
caciones normales. 
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19.1. Aplicaciones unitarias. Una aplicación isomoría de un 
espácio unitario sobre sí mismo se llama aplicación unitaria de 
este espacio. Con más detalle: una aplicación lineal regular U de 
un espacio unitario £ se Mama unitaria, si no altera el valor del 
producto escalar, es decir, si para todos los a y b de £ tiene lugar 


la relación 
(a, 0) =(aU, bU). 0) 


15—1843 
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Las rotaciones del espacio euclideo corriente de tres dimensio- 
nes alrededor del origen de coordenadas O representan el ejemplo 
más sencillo de aplicaciones unitarias. Las reflexiones especulares 
de este espacio respecto a un plano cualquiera que pasa por O re- 
presentan otro ejemplo de aplicaciones unitarias del espacio corriente. 
Se puede probar fácilmente que con las combinaciones de estos dos 
tipos de aplicaciones se agotan todas las aplicaciones unitarias del 
espacio corriente. Por esto las aplicaciones unitarias de espacios 
se pueden considerar como las aplicaciones análogas a las rotaciones 
y a las reflexiones especulares del espacio euclídeo corriente. 

De la igualdad (1), que caracteriza las aplicaciones unitarias, 
se deduce que 


(n =U, yU) = (x, yUUs), 
de donde resulta que 
UUS =F, U =U- y UU. (2) 


Recíprocamente, de las relaciones (2) se deduce que U es inver- 
tible y que 


(a y) =x, YUU”) =U, yu). 


Por consiguiente, una aplicación lineal U es unitaria cuando, 
y solo cuando, la aplicación conjugada U* coincide con la inversa U~*, 

En particular, las relaciones (2) muestran que las aplicaciones 
unitarias son aplicaciones normales en el sentido del punto anterior. 

Tomemos en un espacio £ un sistema ortonormal de coordenadas 

y sea ù una aplicación unitaria de este espacio. Si la matriz de 
A aplicación U es igual a U, la matriz de la aplicación conjugada 
es igual a U', de acuerdo con el p. 18.2. De la relación (2) se 
desprende por lo tanto que 


UŪ'=E. (3) 


Recíprocamente, si la*matriz U de una aplicación lineal Y satisface 
en un sistema ortonormal de coordenadas la relación (3), la propia 
aplicación U satisface las relaciones (2) y es, por consiguiente, 
unitaria. Las matrices U que satisfacen la relación (3) se llaman 
unitarias (p. 1.3); llegamos, por lo tanto, al resultado siguiente: 
toda aplicación unitaria tiene en un sistema ortonormal de coordena- 
das una matriz unitaria; reciprocamente, si la matriz de una apli- 
cación lineal es unitaria en un sistema ortonormal de coordenadas, 
la propia aplicación es unitaria. 

Siendo real el campo principal K las matrices de ias aplicaciones 
también son reales y la relación (3) se convierte en 


U’ =E. (4) 


$ 19. Aplicaciones unitarias y simétricas 227 


Las matrices que satisfacen esta relación han sido llamados en 
el p. 1.3. ortogonales. Es decir, toda aplicación real unitaria tiene 
en una base ortonormal la matriz ortogonal. Recíprocamente, si en 
una base ortonormal la matriz de una aplicación lineal de un es- 
pacio real unitario es ortogonal, la aplicación es unitaria. 

Las aplicaciones unitarias no alteran, por definición, los valores 
de los productos escalares. De aquí resulta que las aplicaciones 
unitarias no alteran las longitudes de los vectores. 

La última propiedad es característica para las aplicaciones 
unitarias: si una aplicación lineal UÙ de un espacio unitario € no 
altera las longitudes de los vectores, la aplicación U es unitaria. 

En efecto, sean a y b unos vectores arbitrarios de L. Tomemos 


al=0a' y bUb. 
Puesto que la aplicación U es lineal, tenemos 
(a+ ob) U=a' + ab" 
para cualquier valor œ del campo de coeficientes. Por hipótesis, la 
aplicación & no altera las longitudes y por lo tanto 
(a+ab, a+0b)=(0'+0b", a'+ab'). 


Realizando aquí la multiplicación y reduciendo los términos seme- 
jantes, obtenemos 


a(b, a)+ala, b)=a(b', a) +3/(a", b’). (5) 
Para «= | esta igualdad se convierte en 
(b, a+ (a, d)=(b", a) +(a, b’). (6) 


Si el campo principal es real, tenemos (b, a)=(a, b) y de (6) re- 
sulta (a, b)=(a”, b’). En cambio, si K no es real, tomando en (5) 
a=i y simplificando en í, llegamos a la relación 


(b, a)—(a, b)=(b", a) —(a”, b’) 
que con (6) da de nuevo (a, b)=(a', b). Luego, tenemos en ambos 


casos 
(a, b) = (a, b) = (aU, bU), 


es decir, la aplicación U es unitaria. 

Examinemos el problema acerca de la transformación de coorde- 
nadas en los espacios unitarios. Sea e, e, , €, una base orto- 
normal de un espacio unitario £ y sea % una aplicación unitaria 
cualquiera de este espacio. Puesto que una aplicación unitaria no 
altera las longitudes de los vectores y transforma los vectores orto- 
sonales en ortogonales, el sistema e,U, e,U, . ..., e, UU será de nuevo una 
base onomat. Recíprocamente, supongamos que una aplicación 
lineal U transforma una base ortonormal e, €, ..., €, en una 


15* 
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base también ortonormal e,U, e,U, ..., eU. Tomemos en L unos 
vectores arbitrarios 


=p Haet. e Y b= Bert Bt Br 
Tenemos 


(a, )=(Zaz, DBe)= B +a, +. -+ aBn 
U, U= (Dae U, BLU) = ap aB H.. H aBa, 


es decir, (a, b)= (aU, bU); luego, la aplicación U es unitaria. Por 
consiguiente, para que una aplicación lineal U sea unitaria es nece- 
sario y suficiente que U transforme una base ortonormal en una 
base ortonormal, 

De aquí también se desprende directamente la proposición siguien- 
te: la matriz del cambio de una base ortonormal por otra es uni- 
taria y, viceversa, si una de las bases es ortonormal y la matriz 
del cambio es unitaria, la otra base es también ortonormal. 

Para Ja demostración basta observar que la matriz del cambio 
de un sistema de coordenadas por otro coincide con la matriz de 
is pei lineal que transforma el primer sistema en el segundo 
p. 8.3). 

Notemos, finalmente, que de la definición de las aplicaciones 
unitarias se deducen fácilmente las siguientes propiedades de las 
mismas: 1) la aplicación idéntica es unitaria, 2) el producto de apli- 
caciones unitarias es unitario y 3) la inversa de una aplicación uni- 
taria es una aplicación unitaria. 


19.2, Equivalencia unitaria. Ligado de un modo 'natural al 
concepto de aplicación unitaria aparece uno de los problemas prin- 
cipales de la teoría de espacios unitarios. Se trata de la clasificación 
de las aplicaciones lineales de estos espacios. Sean Q y £, unos 
espacios unitarios sobre un mismo campo principal K. Consideremos 
dos aplicaciones lineales 4 y 4, de estos espacios con la particu- 
laridad de que £ actúa sobre Y, mientras que 4, actúa sobre %,. 
Las aplicaciones 4 y 4, se llaman semejantes o isomorfas si existe 
una aplicación isomoría de £ sobre £, que transforme la aplicación 
«1 en la aplicación 4; Puesto que todos los espacios unitarios son, 
salvo un isomorfismo, Paren se determinan por su dimensión », 
podemos aceptar que £, coincide con y, que, por consiguiente, 
las aplicaciones 4 y 4, actúan sobre el mismo espacio £. En este 
caso nuestra definición significa que £ y 4, son isomorfas cuando, 
y sólo cuando, existe una aplicación isomoría % del espacio L 
sobre sí mismo que transforma 4 en 4, Como hemos visto en el 
p. 10.2 esto equivale a la condición 


A =UI AU, m 
Si tomamos en £ un sistema ortonormal de coordenadas, la relación (7) 


$ 19. Aplicaciones uniarias y simétricas 229 


puede ser representada en la forma matricial 
A,=U-AU, (8) 


donde U es una matriz unitaria y A y A, son las matrices de las 
aplicaciones lineales dadas. Unas matrices A y A, que satisfacen 
la relación (8) se llaman unitariamente equivalentes. Por consiguiente, 
las aplicaciones lineales de un espacio unitario son isomorfas cuando, 
y sólo cuando, sus matrices, calculadas en una base ortonormal, son 
unitariamente equivalentes. 

Considerando la matriz U de la relación (8) como una matriz 
de cambio, llegamos a la siguiente proposición: unas aplicaciones 
lineales A y B de un espacio unitario & son isomorfas cuando, y sólo 
cuando, en Y existen dos bases ortonormales tales que la matriz de 
la aplicación A calculada en una de ellas coincide con la matriz de 
la aplicación B calculada en la otra. 

sta proposición es totalmente análoga a la correspondiente 
afirmación para espacios lineales arbitrarios que ha sido considerada 
en el p. 10.2, donde se ha dado también una demostración detallada, 

A título de ejemplo, podemos tomar las aplicaciones normales. 
Está claro que para que unas aplicaciones lineales de un espacio 
unitario sean unitariamente isomorfas es necesario que sean isomorfas 
linealmente, es decir, que sean isomorfas como aplicaciones lineales 
de un espacio lineal. Por ello, para que unas aplicaciones lineales 
sean unitariamente isomorfas es necesario us sus polinomios carac- 
terísticos coincidan. Si las aplicaciones dadas son normales y las 
raíces de sus polinomios característicos son conocidas, es posible, 
según el punto anterior, escribir las matrices de estas aplicaciones 
en unas bases ortonormales del espacio convenientemente escogidas. 
Puesto que estas matrices resultarán idénticas, las aplicaciones serán 
unitariamente isomorías. Hemos demostrado, pues,el siguiente teorema: 

TEOREMA 1. Para que unas aplicaciones normales de espacios unita- 
rios, tanto reales como complejos, sean unitariamente isomorfas es 
necesario y suficiente que los polinomios característicos de estas apli- 
caciones coincidan. 

En una forma puramente matricial el teorema | puede ser 
enunciado del siguiente modo: 

TEOREMA la. Para la equivalaencia unitaria de unas matrices A y B 
que conmutan con sus matrices anticonjugadas complejas À y B' 
es necesario y suficiente, tanto en el caso del cuerpo de los números 
complejos como en el caso del cuerpo de los números reales, que los 
polinomios característicos de las matrices A y B coincidan, 

En particular, para toda matriz compleja o real 4, tal que 
AR'=A'A, existe una matriz unitaria U compleja o, respectiva- 
mente, real tal que la matriz UAU”*=UAU” es diagonal en el 
caso complejo y tiene la forma (16) del p. 18.3 en el caso real. 
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Por consiguiente, el isomorfismo unitario de las aplicaciones 


normales resulta ser equivalente al isomorfismo corriente de las 
mismas. 


19.3. Forma normal de la matriz de una aplicación unitaria. 


Como ya hemos señalado, las aplicaciones unitarias son un caso 
particular de las normales. Por esto los teoremas 1 y la, además 
de ofrecer las condiciones necesarias y suficientes para que un iso- 
morfismo sea unitario, ofrecen también la forma normal para las 
matrices de las aplicaciones unitarias, El teorema que sigue indica 
el rasgo característico que distingue las aplicaciones unitarias de 
las demás aplicaciones normales: 

TEOREMA 2, El módulo de todas las raices del polinomio caracte- 
rístico de una aplicación unitaria es igual a la unidad. 

Consideremos primero el caso complejo. En este caso a toda 
raíz œ del polinomio característico de una aplicación unitaria U 
le corresponde un vector propio no nulo a. De las relaciones 


aU=aa y (AU, aU)= (a, a) 


resulta 
(aa, aa) =0x (a, a)=(a, a), 


es decir, aa=|alt=l. 
En el caso real, a toda raíz compleja «=p -+ ¡0 le corresponde 
un par a y b de vectores ortogonales no nulos tales que 


AU =pa—ob y bU =00+pb. 
De aquí tenemos 
(a, a)-+(b, b)=(aU, AU) + (bU, DU) = (p° +02) ((a, a) +(b, b)), 


es decir, 
Pro=japal. 


Observando que entre los números reales sólo los números 1 
y —1 son de módulo igual a la unidad, podemos enunciar el teo- 
rema la en el caso de aplicaciones unitarias en la forma siguiente: 

TEOREMA 3. Para toda matriz unitaria A existe una matriz uni- 
taria compleja U tal que UAU=* será una matriz diagonal con 
elementos diagonales de módulo igual a la unidad. Para toda matriz 
unitaria real A existe una matriz unitaria real U tal que 


cosg, sen q, 

| =i H as] 
COS Pm SEN Par 

canas ee 10) 
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donde E, y E, son matrices unidades de orden s y t, respectivamente, 
ysenpy +0 (¡=1, ..., m), con la particularidad de que algunos 
de los números s, t y m pueden ser iguales a cero, es decir, en la 
fórmula (9) pueden no figurar los términos correspondientes. 

Consideremos, a título de ejemplo, el espacio euclídeo corriente 
‘de tres dimensiones N. Para toda aplicación ortogonal U del espacio 
N se puede encontrar, de acuerdo con el teorema 3, un sistema 
€ €, y €, de vectores perpendiculares unitarios tal que la matriz 
de la aplicación U tomará una de las seis formas siguientes: 


JE 


-l 1 —1 
81! ]| 0 cospsenp| y x) cosp sen« |. 
=l —sen q cos PB =en p cos 


Es evidente Je la aplicación U es la aplicación idéntica en el 
caso a), la reflexión especular respecto al plano e,Oe, en el caso p), 
la reflexión especular respecto a la recta Oe, en el caso y), la 
reflexión especular respecto al origen O en el caso ô), la rotación 
de ángulo ọ alrededor del eje e, en el caso e) y la rotación de 
ángulo q alrededor del eje e, que de la reflexión especular respecto 
al plano e,Oe, en el caso x). Los cuatro primeros casos se pueden 
considerar como casos particulares de los dos últimos con p=0 y 
pon. 

19.4. Aplicaciones simétricas. Una aplicación lineal 4 de un 
espacio unitario € se llama hermitiana o simétrica, si Æ coincide 
con su aplicación conjugada 4°. Es decir, si la aplicación 4 es 


simétrica, se tiene 
(4, y) = (x, yA). (10) 


Reciprozamente, si una aplicación lineal 4 satisface la condición (10) 
cualesquiera que sean x è y de £, la aplicación 4 es simétrica, 

Es evidente que de la condición 4*=.£ se deduce la igualdad 
A4A'=4%A, es decir, las aplicaciones simétricas son aplicaciones 
normales. 

Tomemos en £ una base ortonormal y sea A la matriz de una 
aplicación simétrica 4. La matriz de la aplicación conjugada 4* 
es igual en esta base a la matriz anticonjugada Æ. Tenemos, por 
hipótesis, 4*=.4, de donde _ 

F =A. a1) 


Reciprocamente, de (11) se deduce que 4£*=.4, es decir, que 4 
es simétrica. Las matrices que satisfacen la relación (11) han sido 
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Mamadas en el p. 1.3 hermitianas. Por consiguiente, en una base 
ortonormal a las aplicaciones simétricas les corresponden matrices 
hermitianas y, viceversa, a las matrices hermitianas les corresponden 
las aplicaciones simétricas. 

El ejemplo más sencillo de aplicación simétrica es la aplicación 
de tipo a6, donde a es real. El ejemplo general se obtiene con las 
aplicaciones cuyas matrices tienen, en una base ortonormal, la forma 
diagonal real. y 

La suma de aplicaciones simétricas y el producto de una aplicación 
simétrica por un número real son de nuevo aplicaciones simétricas. 

En efecto, si las aplicaciones 4 y B son simétricas y œ es un 
número real, se tiene 


MUERA PR AB, 
(0AP = aA = ad. 
El producto de dos aplicaciones simétricas es una aplicación si- 


métrica cuando, y sólo cuando, estas aplicaciones son conmutables. 
Efectivamente, de AB=RB4A. A=4" y B=B* se deduce que 
(AB = BPA = BA =AB. 
Recíprocamente, si (AB=43B, A=4* y B=B*, se tiene 
ABZAB) =BA'=BA. 
De aqui se deduce, en particular, que las potencias de una aplica- 
ción simétrica y, en general, los polinomios de coeficientes reales 
en una aplicación simétrica son de nuevo aplicaciones simétricas. 
Los valores propios de las aplicaciones simétricas son reales. 
Efectivamente, sea 4 una aplicación simétrica, sea a un valor 
poris de la misma y sea a un vector propio no nulo correspondiente, 
'enemos ki 
(a, a4)= (a. aa) =7 (a, a), 
(a4, a) = (aa, a)=a (a, a). 
Pero 
(a, ad) = (aA, a). 


Comparando estos resultados, vemos que =e, es decir, que a es 
real, 

Todas las raices del polinomio caracteristico de una matriz hermi- 
tiana son reales. 

En efecto, toda matriz hermitiana A puede ser considerada como 
la matriz de una aplicación simétrica 4 de un espacio unitario. 
Las raíces del polinomio característico de la matriz A son los va- 
lores propios de la aplicación 4 y, por consiguiente, son reales. 

Hemos señalado anteriormente que las aplicaciones simétricas 
son normales. Por lo tanto, para que unas aplicaciones simétricas 
sean unitariamente isomorías es necesario y suficiente, en virtud 
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del teorema 1, que los polinomios característicos de estas aplica- 
ciones coincidan. 

Para toda aplicación normal de un espacio unitario complejo 
existe, según el teorema 6 del p. 18.3, una base ortonormal en la 
que la matriz de la aplicación es de forma diagonal. Puesto que 
todos los valores propios de las aplicaciones simétricas son reales, 
la matriz diagonal indicada será real en el caso de aplicaciones 
simétricas; obtenemos así el teorema siguiente: 

TEOREMA 4 Toda aplicación simétrica de un espacio complejo uni- 
tario tiene, en una base ortonormal adecuada, una matriz diagonal real. 

La recíproca es támbién válida, ya que si la matriz de una 
aplicación lineal n una base ortonormal es de forma diagonal 
real A, se tiene F=A Ya por consiguiente, 4*=4. 

En términos matriciales el teorema 4 puede ser enunciado de 
la forma siguiente. 

TEOREMA 4a. Para toda matriz hermitiana A existe una matriz 
unitaria compleja U tal que la matriz UAU=* es de forma diago- 
nal real, 

Consideremos ahora el caso en que £ es una aplicación simé- 
trica de un espacio unitario real. Según el teorema 8 del p. 18. 
la matriz de la aplicación .4 se descompone, en una base ortonor 
mal adecuada, en células de orden | ó 2. Además, las células de 
orden 2 aparecen sólo cuando el polinomio característico de la 
aplicación tiene raíces no reales. Pero los polinomios característicos 
de las aplicaciones simétricas no tienen raíces que no sean reales. 
Por consiguiente, también en el caso real la matriz de una aplica- 
ción simétrica se reduce a la forma diagonal en una base ortonor- 
mal adecuada. La recíproca, obviamente, es también válida, de 
modo que tiene lugar el teorema siguiente: 

TEOREMA 5. Para toda aplicación simétrica de un espacio unitario 
real existe una base ortonormal en la que la matriz de la aplicación 
adquiere la forma diagonal. 

En una base ortonormal las_matrices de las aplicaciones simé- 
tricas satisíacen las relaciones A= A. En el caso real está relación 
se convierte en la igualdad A'= A. Las matrices que satisfacen esta 
igualdad se Haman simétricas (p. 1.3). Por consiguiente, en una 
base ortonormal las matrices de las aplicaciones simétricas reales 
son simétricas y, viceversa, las aplicaciones son simétricas si sus 
matrices son simétricas reales. Esta observación permite enunciar 
el teorema 5 del modo siguiente. 

TEOREMA 5e. Para toda matriz simétrica real A existe una matriz 
unitaria real U tal que la matriz UAU"1 es de forma diagonal. 


19.5. Aplicaciones antisimétricas, Sea un espacio unitario. 
Una aplicación lineal 4 se lama antisimétrica, si está ligada a su 
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aplicación conjugada por la relación 
A=—A. (12) 
Siendo a y b vectores arbitrarios de £, de (12) se deduce que 
(a, bA)=(2.4", b)=—(a4, b). 
Recíprocamente, si para cualesquiera a y b se tiene 
(a, bA) = — (a4, b), 

resulta que 4 =— A* y A es una aplicación antisimétrica. 

En el caso en el que el campo principal es el cuerpo de los 
números complejos, las aplicaciones 'anlisimélricas tienen una expre- 


sión muy anella mediante las simétricas. En efecto, sea 4 una 
aplicación simétrica de un espacio £. Entonces 


(iAy =T= iA, 


es decir, la aplicación ¡4 es antisimétrica. Reciprocamente, si la 
aplicación 4 es antisimétrica, se tiene 

A =id'=id, 
y, por consiguiente, la aplicación ¿Æ es simétrica. En los espacios 
reales esta relación desaparece. 

Tomemos una base ortonormal en un espacio unitario £ e indi- 
quemos por A la matriz de una aplicación antisimétrica 4. Puesto 
que la matriz de la aplicación conjugada 4* es igual a A”, la 
condición (12) da 

Fo—A. (13) 
Viceversa, de (13) se deduce, obviamente, que 4 es una aplicación 
antisimétrica. Las matrices que verifican la relación (13) se llaman 
matrices hermitianas antisimétricas. Por consiguiente, en una base 
ortonormal a las aplicaciones antisimétricas les corresponden las mat- 
rices hermitianas antisimétricas y, viceversa, a las matrices hermi- 
tianas antisimétricas les corresponden aplicaciones antisimétricas. 

De la relación (12) se deduce directamente que la suma de apli- 
caciones antisimétricas y el producto de una aplicación antisimétrica 
por un número real son de nuevo aplicaciones antisimétricas. 

Todo valor propio de una aplicación antisimétrica o bien es igual 
a cero o bien es un número imaginario puro. 

Si æ es un valor propio de una aplicación antisimétrica 4 y a 
es un vector propio no nulo correspondiente, se tiene 


(a, a4)=(a, aa)=(a, a), 
(ad, a) = (aa, a)=a(a, a). 


Pero (a, a4)=— (a4, a) y, por consiguiente, —a=u que es lo 
que se quería demostrar. 
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En particular, de aquí resulta que foda raíz del polinomio ca- 
racterístico de una matriz hermitiana antisimétrica o bien es igual 
a cero o bien es un número imaginario puro. 

Puesto que de la relación 4* A se deduce inmediatamente 
la igualdad 4*4= 44", las aplicaciones antisimétricas resultan ser 
un caso particular de las aplicaciones normales y, por ello, para 
hallar la forma más sencilla de las matrices de las aplicaciones 
antisimétricas es suficiente recurrir al teorema 8 del p, 18,3. Así se 
obtiene el teorema siguiente: 

TEOREMA 6. En una base ortonormal adecuada de un espacio uni- 
tario real la matriz A de una aplicación antisimétrica toma la forma 


AA TA af o 
A=0,+ E3 Je Le ol’ (14) 
donde O, es la matriz nula de orden k, 

Efectivamente, en una base ortonormal adecuada la matriz de 
la aplicación dada se descompone, según el teorema mencionado, 
en células de órdenes 1 y 2. De la relación (13) se ve que también 
las células aisladas deben satisfacer esta misma igualdad. Las células 
de orden 1 son números reales p; y la relación (13) da para ellas 
P,=—P,=—pp es decir, p,=0. En cambio, si la célula es de 
orden 2, de (13) resulta que debe ser de la forma 

0 o 
A= lio; al 
que es lo que se quería demostrar. 

En términos matriciales el teorema 6 se puede enunciar de modo 
siguiente: 

E ron sn. Para toda matriz antisimétrica real A existe una 
matriz unitaria real U tal que la matriz U AU~ es de ln forma (14). 

Para las matrices reales los conceptos de matriz unitaria y de 

matriz ortogonal son equivalentes y por esto en los teoremas 5a y 6a 


las palabras unitaria real pueden ser sustituidas por las palabras 
unitaria ortogonal. 


19.6. Aplicaciones simétricas no negativas. Una aplicación simé- 


trica £ de un espacio unitario Y se llama no negativa, si para todo 
x de Ẹ se tiene 


(XA, x)>0. (15) 
Aquí el signo de desigualdad tiene sentido, ya que en el caso 
de aplicaciones simétricas el producto escalar (x4, x) es siempre 
real. Si el signo de igualdad tiene lugar en (15) sólo para el vector 
nulo, se dice que .4 es una aplicación positiva o definida positiva. 
Una combinación lineal de aplicaciones no negativas con coeficientes 
reales no negativos es una aplicación no negativa. 
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Esto se ve directamente de la fórmula 
(xlaA +BB), x)=0 (xA, x)+P (xB, x). 


El producto de cualquier aplicación lineal por su conjugada es 
una aplicación simétrica no negativa. 
Efectivamente, 
(AA, x)=(x4, xA) > 0, 
(XAA, x)= (xA, xA) >0. 
El cuadrado de cualquier aplicación simétrica es una aplicación 
no negativa. 
Resulta de la anterior, ya que toda aplicación simétrica es con- 
jugada de sí misma. 
Todos los valores propios de una aplicación no negativa son reales 
y no negativos. 
Sea 4 una aplicación no negativa, sea œ un valor propio de la 
misma y sea a un vector propio no nulo correspondiente. Entonces 


(a4, a)=a(a, a) >0. 


Por consiguiente, se tiene a. >0. 

Si los valores propios de una aplicación simétrica de un espacio 
unitario 2, complejo o real, son no negativos, la aplicación es no 
negativa. 

En £ existe, en virtud del p. 19.4, una base ortonormal e, 
formada por los vectores propios de la aplicación 4. Sean a, 
los valores propios correspondientes y sea 


x= bie, HEt o H Enen 
un vector arbitrario de £. Entonces 


(ad, = at Hat abi 
=a | PH- -Hanlin >0 (16) 
que es lo que se queria demostrar. 

El determinante de la aplicación 4 es igual a 2,0%, ... dp. Si él 
es diferente de cero, todos los números œ; son mayores que el cero 
y la suma (16) será igual a cero en este caso sólo para x=0. Por con- 
siguiente, la aplicación 4 será en este caso definida positiva. 
En cambio, si |.4|=0, uno de los valores propios, digamos œ,, es 
igual a cero. Entonces 

(ey A, e)=0(8,, e,)=0 
y la aplicación 4 no será definida positiva. 

Por consiguiente, una aplicación simétrica no negativa es definida 
positiva cuando, y sólo cuando, es regular. 

Consideremos ahura la operación de extracción de la raiz cuad- 
rada de una aplicación lineal. Se dice que una aplicación lineal 7 
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es raíz cuadrada de una aplicación lineal 4, si 
T= (17) 
Según sea la aplicación .£, la ecuación (17) puede no tener solu- 
ciones, puede tener sólo un número finito de soluciones y puede tener 
un número infinito de soluciones. Sin embargo, en el caso de apli- 
caciones simétricas no negativas la situación es bien determinada. 
TEOREMA 7. Para toda aplicación simétrica no negativa A de un 
espacio unitario existe una aplicación simétrica no negativa B, y sólo 
una, que cumple la relación 


PB=A. 
Toda aplicación lineal que conmuta con A es conmutable con B. 

DEMOSTRACIÓN. Tomemos en L una base ortonormal e,, ..., €. 
formada por los vectores propios de la aplicación Z. Tal base existe 
de acuerdo con el p. 19.4. Indiquemos por œ, ..., a, los valores 
propios correspondientes de la aplicación 4. Sea 3 la aplicación 
linea) que transforma e, en Vag, (i=1, ..., n), donde se toman 
los valores no negativos de los radicales. Puesto que e,, ..., €, es 
una base ortonormal formada por los vectores propios de la apli- 
cación By puesto que los valores propios de ésta son iguales a 
Va... V E es decir, son no negativos, resulta que B es una 
aplicación simétrica no negativa. Pero 

eBP=ae=e (=l, o., n) 
Por Jo tanto, B*=.4. Hemos demostrado que la raíz cuadrada 
requerida de 4 existe. 

Demostremos la última afirmación del teorema. Sea 2 una apli- 
cación lineal que conmuta con 4. Tomemos los vectores coordenados 
81, ..., €, en tal orden que los valores propios iguales, si es que 
existen, correspondan a vectores coordenados adyacentes. Entonces 
las matrices de las aplicaciones £ y B serán, respectivamente, de 


la forma 
[mE 


aE, 
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donde «a, ..., æ, son distintos valores propios de la aplicación £ y 
E, son matrices unidades. Representemos la matriz de la 
aplicac n Y en la forma celular correspondiente 


Xu Xu 
Xu Xa 


y Ka 


De la condición AX =XA tenemos 


ax MEX (j, k=l, 2, ..., S), 
es decir, 


(aja) X a= 0. 


Puesto que «j£ æ, para jk, tenemos X y =0 (jk). Por consi- 
guiente, 


PE y O 
x=] 9 ža 01 
030 2 La 
pero entonces 
Va Xu 
BX = . =XB 
Va xs j 


que es lo que se quería demostrar. 

Resta demostrar la unicidad. Sea € otra aplicación simétrica 
no negativa tal que €*=.4. Correspondientemente a la descompo: 
sición celular de la matriz A señalada anteriormente, el espacio Y 
se descompondrá en la suma directa de los subespacios invariantes 
Y j=1, ...,5). Puesto que 84=48, los subespacios Q) serán 
también invariantes, de acuerdo con lo demostrado, respecto a $. 
Como $ es simétrica, en cada uno de los subespacios Y, existe una 
base ortonormal formada por los vectores propios de 8. Sean 
Ye go 7 los valores propios correspondientes. Indiquemos por 

£, las aplicaciones inducidas en el subespacio Y, por las 
adon la, B y €, respectivamente, tenemos 


Aj=0)6) B=V 086) y Ei=up 
de donde 


w=... = ypa 
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Puesto que todos los números yy, 


+» Y, Son no negativos, de aqui 
se deduce que 


n= 


y, por consiguiente, 8,23/2,6,=3B), es decir, € = 2. 

Demostremos, como ejemplo de una aplicación directa del teorema7, 
que el producto de aplicaciones simétricas no negativas conmutables 
es una aplicación no negativa. 

En electo, sean Al, y A, unas aplicaciones simétricas no nega- 
tivas que conmutan. Indiquemos por B, y $, sus raíces cuadradas 
que, según el teorema 7, se pueden escoger de manera que conmuten 
y que sean simétricas y no negativas. Tenemos entonces 


(3,9) = B, BB, B, = BIBI = Ay hy, 


es decir, «f,vt, es igual al cuadrado de una aplicación simétrica B,B,. 
Luego, #4, es no negativa. Hemos demostrado la proposición. 

ella se desprende, en particular, que los polinomios con coe- 
ficientes reales no negativos en una aplicación simétrica no negativa 
son también aplicaciones simétricas no negativas. 


a i Va; 


Ejemplos y problemas 


1. Sen eu, es y es una base ortonormal de un espacio unitario Q. Hállense 
las matrices de fas al licaciones unitarias que transforman los vectores e, y e, en 
los vectores FA+FFO—=G 0 y E te 

2. Si ay ».0+ Gm Y br, -»., Om son dos sistemas ortonormales de vectores 
de un espacio unitario € de n dimensiones (m < n), existe una aplicación unitaria 
de Ẹ que transforma el primer sistema en el segundo. 

Para que un sistema de veciores an, - 0 de un espacio unitario pueda 
ser transformado por una aplicación unitaria en otro sistema Dj, ..., bp es 
necesario y suficiente que las matrices de Gram de estos sistemas coincidan 
(véase el problema 5, pág. 215). 

4. Demuéstrese, empleando la forma normal de Jordan y el proceso de orto- 


sorfismo, sólo dos funciones 
lineales. En un espacio unitario las funciones lineales son, salvo un isomorfismo, 
de la forma a (x, e), donde e es un vector unitario fijo. 

7. En una base ortonormal de un espacio euclídeo las matrices de las apli- 
caciones A, $8 y B son iguales respectivamente 


524 424 134 
222|, |212] y |-122Í. 
425 424 102 
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Demuéstsese que „4 es definida positiva, que P es no negativa y que €, 
aun no siendo simétrica, es tal que (x8, x)=>0 cualquiera que sea x. 

8. Háilese la raíz cuadrada simétrica no negativa de la aplicación B del 
problema anterior. 

9. La matriz de una aplicación simétrica no negativa, calculada en una base 
ortonormal, se llama hermitiana no negativa. Pruébese que una matriz hermitiana 
ea no megaliva cuendo, y sólo cuando, se aiternan los signos de los coeficientes 
de su polinomio característico. Además, si uno de los coeficientes es Igual a cero, 
también tienen que ser iguales a cero Jos coeficientes de los términos de grado 
menor. 

10, Demuéstrese que de toda aplicación normal Æ se puede extraer la raíz 
de cualquier grado positivo n, es decir, demuéstrese que para toda aplicación 
normal 4 existe una aplicación normal 2 que satisface la relación 2" =. 
¿Cuál es el número máximo de tales aplicaciones „Z? 

11. En un espacio unitario € se ha tomado una base ortonormal, Demuéstrese 
que en esta base la matriz de todo aplicación simétrica no negativa f de rango 

puede ser representada en la form: 


A=1T ix), 


de un vector x convenientemente escogido. 
-a no negativa es una suma de aplicaciones simé- 


donde [xj es la fila coordena 
12. Toda aplicación simé! 
tricas no negativas de rango 1. 
13. Si unas matrices hermitianas de elementos ayy y By son no negativas, 
la matriz de elementos y;y==0¡yBjy es también no negativa (i, j=1, 2. n) 


§ 20. Descomposición de aplicaciones generales 


Las aplicaciones unitarias, simétricas y antisimétricas tienen una 
estructura geométrica muy clara. Por esto al estudiar las aplicacio- 
nes lineales generales de espacios euclídeos o unitarios resulta na- 
tural preguntarse si es posible expresar de algún modo simple estas 
aplicaciones en términos de las aplicaciones especiales mencionadas. 
Algunos de estos métodos, que son de importancia principal, se 
consideran precisamente en este parrágrafo. 


20.1. Descomposición en partes simétrica y antisimétrica. Sea L un 
espacio unitario complejo y sea 4 una aplicación lineal del mismo. 
Designernos 

a) 


1 1 
BFU+A) y Coqld—a 


Tenemos 
BAH A) =B y E GA A). 
Por consiguiente, 8 y € son simétricas. De (1) resulta 
A=3B +18. e 
Es decir, toda aplicación lineal A de un espacio unitario complejo 
puede ser representada en la forma (2), donde B y son aplicaciones 


simétricas. Esta representación es unívoca, ya que de (2) se deduce 
que 


—i6*=38—i8, 
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de donde obtenemos para B y € de nuevo las expresiones (1). 
Si el campo principal es real, la descomposición (2) no sirve. 


En este caso se procede del modo siguiente. A una aplicación 
arbitraria. Pongamos 
DBazld+A) y E=z(A— A) 3) 


De aqui resulta 
A=B+€. (4 
Puesto que 


B=} y C=z (AA) = 8, 


en la cecompotición (4) B es una aplicación simétrica y € es una 
aplicación antisimétrica. La descomposición (4) es univoca, ya que 
de ella se deduce que 4*=M—€ y de aquí obtenemos para B y € 
de nuevo las expresiones (3). Por consiguiente, toda aplicación lineal 
puede ser representada como la suma de una aplicación simétrica y 
una aplicación antisimétrica. Esta representación es unívoca. 

Es evidente que la descomposición (4) sirve cualquiera que sea 
el campo principal. La aplicación B se Mama parte simétrica y la 
aplicación 6 se llama parte antisimétrica de la aplicación 4. 

Desde el punto de vista del cálculo de matrices, la descompo- 
sición (2) significa que toda matriz cuadrada A se puede representar 
en la forma B+iC, donde B y C son matrices hermitianas, mient- 
ras que la descomposición (4) significa que toda matriz cuadrada A 
puede ser representada en la forma B+C, donde B es una matriz 
simétrica y C es una matriz antisimétrica. 


20.2. Descomposición polar. Desde el punto de vista geométrico 
es de mucho mayor interés la representación de una aplicación lineal 
como el producto de unas aplicaciones simétrica y unitaria. La po- 
sibilidad de tal representación se basa en el lema siguiente. 

Lema. Sí las aplicaciones lineales A y B de un espacio unitario & 
alteran igualmente las longitudes de los vectores”, es decir, si para 


cualquier a 
(ad, aA) =(aB, aB), (5) 


existe una aplicación unitaria U del espacio Y tal que AU =B. 
“Consideremos el dominio de valores de la aplicación Z, es decir, 
el conjunto de vectores de tipo x4, donde x recorre todo el espa- 
cio £. Indiquemos por A este dominio. Análogamente, indiquemos 
por $ el dominio de valores de la aplicación 3. A y Y son, según 
el p. 10.1, unos subespacios lineales. Queremos, ante todo, establecer 
una correspondencia isomorfa entre A y B. Sea a un vector de Al. 


D Las aplicaciones A y B que poseen esta propiedad se llaman métricamente 
iguales, 


16—1843 
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Busquemos en £ un vector x tal que x4=a y tomemos xB=b. 
Convengamos en decir que b es la imagen de a y en indicarla por a7?. 
Probemos que a determina univocamente a b. En efecto, lo contra- 
rio puede acontecer sólo si el vector x no se determina unívoca- 
mente por la condición xW4=a. Sin embargo, si x, es otro vector 
tal que x=a, tenemos (x—x,) 4 =0. De aquí se deduce, en 
virtud de (5), que 


(A) B, (x— x) B) =((:—x,) A, (1x1) 1) =0, 


es decir, que (x—x,)B=0 ó x, =x que es lo que se quería 
demostrar. Hemos probado de esta forma que 7° es una aplicación 
unívoca de A en B. Sin embargo, es fácil ver que 9? es una apli- 
cación biyectiva de A sobre N. Efectivamente, siendo b un vector 
de X, existe en £ un vector x tal que xB=b. Tomando entonces 
xA =a, tendremos a7? =b que es lo que se quería demostrar. 

De la misma definición de la correspondencia Y? se desprende 
que para todo vector x de Q es válida la igualdad 


XAP =x. (6) 


Empleando esta igualdad se puede probar que 9? es una aplicación 
isomorfa de Y sobre Y. Efectivamente, sean a, y a, unos vectores 
de A. Busquemos en Q unos vectores x, y x, tales que x,4=a, y 
xl =a,. Tenemos entonces 


(aa, + Ba) Y = (ax, A + BLA) P = (ax, + Bx,) AP (ax, +Px,) Bu 
=a (xB) + P (xB) =a (1,197) + B KAV) =00,9 + Ba, (7) 


es decir, Ja aplicación 9? conserva las operaciones de adición y de 
multiplicación por número. Además, 


(PP, AP) = AP, AP) =(x,B, x,B) = 
= (x, x:4)=(4, a), (8) 
es decir, la aplicación %° conserva las longitudes de los vectores. 
Por consiguiente, Y? es un isomorfismo. 

Tenemos definida la aplicación 9? sólo para los vectores de A. 
Queremos ahora definirla también en todos los demás vectores del 
espacio £. Con este fin consideremos los subespacios ortogonales 
AL y BL. Para L son válidas, de acuerdo con el p. 17.5, las des- 
composiciones directas 


L=} A=B} BL, 


Los subespacios A y B son isomorfos y, por lo tanto, tienen la 
misma dimensión. Pero entonces los complementos ortogonales A4 
y Bl también tienen la misma dimensión, Como los espacios uni- 
tarios de una misma dimensión son isomorfas, debe existir una 
aplicación biyectiva de AL sobre BL que conserva las operaciones 
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de adición y de multiplicación por número y que no altera las lon- 
gitudes de los vectores. Indiquemos esta aplicación por %”. Luego, 
si a' y a” son unos vectores de AL, los vectores a" y a% per- 
tenecen a Bi y 


(aa +Ba) W= a (0) + Bla Y), (9) 
EP, Y) = (a, d). (10) 


Definamos ahora una aplicación Y del espacio £ del modo siguiente 


Sea x un vector cualquiera de £. Puesto que L=2A-+2L, el vector x 
se puede representar univocamente en la forma 


xxx (EN y x EAL). ul 
Tomemos, por definición, 
UPA. a (12) 
La aplicación U es lineal, ya que si 
y=y+Y (Ed e y EA), 
de (7), (9) y (11) resulta: 

(ox + By) U = (ax' + By) I 4 (0x" + By") W = a (xU) +P (yU). 
La aplicación U es unitaria, ya que debido a (8), (10) y (11) se 
tiene 

QU, W= KP ALW, PALPE 
SKP, HLW, LW) <=, KHH) =, x) 
Para todo x de Y es válida la relación 
XAU =xB. 


Efectivamente, v4 pertenece a N; luego, el vector x” de la descom- 
posición (11) es igual a cero y, por consiguiente, 


XAU = XAP. 


Teniendo en cuenta (6), esto da x4U=x8. De aquí resulta 
AU=B y el lema queda demostrado. 

TEOREMA 1 Toda aplicación lineal A de un espacio unitario Y 
admite una descomposición polar 


A=2DU, (13) 


donde D es una aplicación simétrica no negativa y U es una aplicación 
unitaria del espacio £. La aplicación D se determina univocamente, si 


A es una aplicación regular, la aplicación U tambien se determina 
unívocamente. 


16+ 
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La aplicación 44* es, según el p. 19.6, simétrcia y no negativa. 
Indiquemos por ® la raíz cuadrada simétrica no negativa de 4A4*. 
Es decir, 

DAA". 


Tenemos cualquiera que sea el vector x 
(A, xA) =(%, XAA) =(x, xD) =(xD, xD), 


es decir, las aplicaciónes 4 y D alteran igualmente las longitudes 
de los vectores. Basándonos en el lema, deducimos de aquí que 
existe una aplicación unitaria U tal que 


DU=A. 


Con esto queda demostrada la existencia de la descomposición polar, 
Resta examinar su unicidad. De (13) resulta 4*=U'D “9D y 
AA = DUU D =D. Por consiguiente, la aplicación es no 
negativa y simétrica y su cuadrado es igual a la aplicación Lu”. 
Según el teorema 7 del p. 19.6, estas condiciones determinan uní- 
vocamente la aplicación WD. Si 4 es una aplicación regular, también 
£D es regular y de (13) resulta entonces que U=D"1.£, es decir, 
la aplicación Uù también se determina univocamente. 

1 significado geométrico del teorema 1 es muy sencillo, Indica 
precisamente que la acción de toda aplicación lineal del espacio £ 
puede ser representada de la forma siguiente: primero el espacio & 
se dilata en n direcciones recíprocamente ortogonales con un coefi- 
ciente de dilatación concreto, real y no negativo, en cada una de 
las direcciones y después gira alrededor del origen de coordenadas ”. 
Si la aplicación es regular, todos los coeficientes de dilatación son 
estrictamente positivos. En el caso de una aplicación singular algunos 
de los coeficientes resultan iguales a cero y en Jugar de la dilata- 
ción en las direcciones correspondientes tiene lugar la proyección 
del espacio. 

Observemos también que en la demostración de la existencia de 
la descomposición polar nos hemos basado en el producto LW”. 
Si en lugar de él tomamos el producto 4*4, obtendremos la des- 
composición de tipo 


A=UD, 


donde Y es unitaria y D, es una aplicación simétrica no negativa. 

Tomemos en el espacio £ un sistema ortonormal de coordenadas, 
A las aplicaciones unitarias les corresponden entonces matrices uni- 
tarias y a las aplicaciones simétricas les corresponden matrices 
hermitianas y el teorema 1 se convierte en la proposición siguiente: 
toda matriz cuadrada puede ser representada en la forma de un pro- 
ducto de una matriz hermitiana y otra unitaria. 


V Ei giro se entiende en el sentido de una aplicación unitaria. 
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Suponiendo que el campo principal es el cuerpo de los números 
reales, obtenemos que toda matriz cuadrada real puede ser represen- 
tada como el producto de una matriz simétrica real y otra ortogonal 
real. 

En el teorema 1 se afirma que Ø es una aplicación simétrica 
no negativa. De acuerdo con esto en las dos últimas proposiciones 
a las palabras hermitiana y simétrica se puede agregar: de valores 
propios no negativos. 


20.3. Aplicación de Cayley. Comparando las propiedades de las 
aplicaciones unitarias con las propiedades de las aplicaciones simé- 
tricas, podemos notar que ambas clases de aplicaciones están ligadas 
estrechamente, En forma explícita esta relación queda expresada en 
las asi llamadas fórmulas de Cayley. 

TEOREMA 2 (aplicación de Cayley). Si 4 es una aplicación simé- 
trica de un espacio unitario complejo, las aplicaciones A + ¡$ son 
invertibles; la aplicación U definida mediante la fórmula 


Um (A—IE) AH 16) (14) 


es unitaria, no tiene valores propios iguales a la unidad y, además, 
A se expresa mediante UÙ por la fórmula 

A= ¡(Uy E (U=6)". (15) 
Reciprocamente, si U es una aplicación unitaria que no tiene valores 
propios iguales a la unidad, la aplicación U—$ es invertible, la 
aplicación A calculada mediante la fórmula (15) es simétrica y ù se 
expresa mediante A en la forma (14). 

DEMOSTRACIÓN. Sea «£ una aplicación simétrica de un espacio 
unitario, Los números Ei no pueden ser valores propios de la 
aplicación 4, ya que todos los valores propios de las aplicaciones 
simétricas son reales G 19.4). Esto significa que las aplicaciones 
«4 + ¡6 son regulares. Puesto que las aplicaciones 4+ 18 y A—i8 
conmutan, resulta que ellas coninutan también con las aplicaciones 
(A+ 186) y (4—i6)!. Para la aplicación U definida mediante 
la fórmula (14) existe la conjugada que es igual a 


U (AH ¡EY A— 6 Y =(A— 18)” (A+-16). 
Tenemos de aquí 
UUW = (AB AH IE) (AiE) AH iS) = 
=(A—i6 (A +i (A + ¡6 Ais =e, 
es decir, U es unitaria. Probemos que U—$ es invertible. Para 
ello restemos de ambos miembros de la igualdad (14) la aplicación € 


y multipliquemos los resultados por 4+:i8. Después de efectuar 
transformaciones evidentes, tendremos 


(U—8) (A+ iE) =—218, (16) 
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es decir, 
(UE) "== (A+ 18). 


Por consiguiente, Y no tiene valores propios iguales a la unidad. 
Además, de (16) resulta: 


(U—$) A 218 U—$)=—i(U+ E), 


d— (Ud E NUS)". 
Hemos demostrado la primera parte del teorema. La demostración 
de la reciproca es análoga totalmente a la demostración realizada. 
Las fórmulas de Cayley establecen una correspondencia biyectiva 
entre todas las aplicaciones simétricas de un espacio unitario £ y 
aquellas aplicaciones unitarias U del mismo para los cuales 1 no es 
valor propio. Análogamente, las fórmulas 
U=(i + A) EA)", (14) 
A= (UB) (U+ (15) 
ofrecen una correspondencia biyectiva entre las aplicaciones simét- 
ricas del espacio y aquellas aplicaciones unitarias U para las 
cuales —1 no es valor propio. 
Las aplicaciones (14) y (15), así como las aplicaciones (14) 
y (15°), son posibles gracias a que en el campo principal existe el 
número i. Si el campo principal es real, las fórmulas indicadas no 
son válidas. Sin embargo, es fácil modificar estas fórmulas de ma- 
nera que sean válidas para cualquier campo. Tiene lugar el tecrema 
siguiente: 
TEOREMA 3. Sea 4 una aplicación antisimétrica de un espacio 
unitario Q. Entonces las aplicaciones A + £ son invertibles, la apli- 


es decir, 


cación 
U =(A8B NAH)" (17) 
es unitaria, no tiene valores propios iguales a la unidad y, ademas, 
A=— (UH e UB)". (18) 


Reciprocamente, si U es una aplicación unitaria y la unidad no es 
valor propio de la misma, la aplicación A definida mediante la fór- 
mula (18) es antisimétrica y U se expresa mediante ul en la forma (17). 

En efecto, si 4 es antisimétrica, los números +1 no pueden 
ser sus valores propios, ya que todos los valores propios de las 
aplicaciones antisimétricas o bien son iguales a cero o bien son 
imaginarios puros (p. 19.5). Por esto las aplicaciones 4 + & son 
regulares, Puesto que (4+48)(4—68)=(4—68) (4-+é) tenemos 


(A—8 NA +E) =(4 48)” (4—6). De (17) resulta 
U=(A 48)" (4*—8) =(— A+ 6) (— A—8)= 
(AE) (4+8), 


$20. Descomposición de aplicaciones generales 247 


de donde 
UU = (AE NAF EJ AY A+ 6)=6, 


es decir, la aplicación Y es unitaria. Los razonamientos ulteriores 
son totalmente análogos a los realizados en la demostración del 
teorema 2 y, por ello, Jos omitimos. 

Para concluir, observemos que los resultados de los últimos pa- 
rágrafos descubren cierta semejanza entre las propiedades de las 
aplicaciones lineales de los espacios unitarios y las propiedades de 
los números complejos. Convengamos en aceptar que las aplicaciones 
líneales son, en cierto sentido, análogas a los números complejos y 
que las aplicaciones conjugadas son análogas a los números conju- 
gados. Entonces las aplicaciones simétricas, que se caracterizan por 
la condición 4*=4f, serán análogas a los números complejos que 
satisfacen la relación z=z, es decir, a los números reales; 
aplicaciones antisimétricas, que se caracterizan por ła cond 
A"= A, serán análogas a los números complejos que satisfacen a 
la relación z=— z, es decir, a los números imaginarios puros; las 
aplicaciones unitarias con la propiedad UU*=6 serán análogas a 
Jos números complejos z para los cuales 22=1, es decir, }z|= 1. 
La descomposición 4=B-+16 del punto 20.1 corresponderá a la 
representación de un número complejo 2 en la forma cartesiana 
z=x-+ij y la descomposición polar 4=MU corresponderá a la 
representación de un número complejo en la forma trigonométrica 
z=p(cosp + iseng), ete. 


20.4, Descomposición espectral. Desde el punto de vista geométrico uno de 
los tipos más sencillos de as aplicaciones lineales es la proyección de los vec 
lores sobre un subespacio. Algunas de las propiedades de estas aplicaciones 
proyectivas serán ahora consideradas, 
Sea N un subespacio lineal de un espacio unitario . El conjunto de vec- 
tores ortogonales a Y es el subespacio ortogonal A+ y £ es la suma directa de A 
UL, Luego, todo vector a de £ puede ser representado univocamente en la 


forma 
a=a'4a (“EA y reut). (19) 
El vector a' se Mama proyección del vector a sobre el subespacio A. Poniendo 
en correspondencia a todo vector su proyección sobre Y, obtenemos una aplica: 
ción del espacio £ que se Mama progectiva y se indica por Pg + Es decir, se 
toma por definición 
aym o. 


A veces, para abreviar la notación, omitiremos el indice Y y en lugar de Pa 
escribiremos P. j 

Las aplicaciones proyectivas son lineales, ya que si para un vector a tiene 
lugar la descomposición (19) y para otro vector b la descomposición 


b=r40r (VEA y VENH), 
an +Bb=(aa' +0") + (aa +80, 


resulta 
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es decir, (aa + Bb) (P=aa'+Bb', de donde 
(aa +B0) P=a-oP+B09. 


Las aplicaciones proyectivas son aplicaciones simétricas no negativas. Efecti- 
vamente, de la descomposición (19) tenemos 


aP, a= (e, a+) =(a', a) >=0, 
es decir, [P es no negativa. Por otra parte, si 
b=b'4t (VEA y brEAL), 


tenemos 
CP, = (a, H=, 0) =(a'4a", 0) =(a, EP), 


es decir; la aplicación P es simétrica. 
De la fórmula (19) se desprende también otra propiedad importante de las 
aplicaciones proyectivas, Es evidente que para cualquier a tenemos 


APP ma), 
Pap. (20) 


Las aplicaciones que coinciden con su cuadrado se llaman idempotentes. Por 
consiguiente, de (20) resulta que fodas las aplicaciones proyectivas son idempo- 
ten 


de donde 


clprocamente, las propiedades de simetría, y de idempotencia caracterizan 
plenamente las aplicaciones proyectivas; foda aplicación simétrica idempotente P 
ës la proyección sobre el dominio de valores de P. 

Sea Y el dominio de valores de P. Para lodo a es válida la descomposición 


ama P +a (8D) en 
El sumando a.) pertenece, por definición, a A. El segundo sumando es orto- 
genal a Y, ya que lodo vector de Wes de la forma P, donde x es un vector 
le £, y debido a que la aplicación 2P es simétrica e idempotente tenemos 
EP, a (E-P =i, BP) P) =i AP a G)=0. 


Por lo tanto, la descomposición (21) muestra que a.P es la proyección del 
vector a sobre % que es lo que se quería demostrar. 
Hallemos la forma más sencilla de la matriz de una aplicación proyectiva 


Pa- Tomemos en Y y en UL unas bases ortonormales e. Cm Y emer oos Ono 
El sistema unido ên -.., êm Emtis -++ en Será una base ortonormal del espa- 
cio £. Las igualdades 
Pz y e P=0 =l, ..., ma=m+l, ..., n) 
muestran que la matriz de la aplicación Py en esta base es de la forma 
Fl 
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Reciprocamente, si en un sistema ortonormal de coordenadas la matriz de una 
aplicación lineal £P se reduce a la forma (22), es evidente que [P es una apli- 
cación proyectiva: 

Sean P y Q las operaciones de proyección de un espacio R sobre unos 
espacios Y y 8: Surge la pregunta: ¿cómo la posición de los subespacios 
N y B en £ influye en las propiedades de las aplicaciones P y Q? Por ejemplo, 
¿qué puede decirse sobre P y Q, si U y B son ortogonales o si A pertenece 
a Q, ete.? Para responder a estas preguntas introduciremos, ante todo, la defl- 
nición siguiente: dos aplicaciones proyectivas P y Q se llaman ortogonales, si 
PQ=6. Puesto que las aplicaciones proyeciivas son simétricas, tenemos de aquí 

UPA P" =(P =. 
es decir, si P es ortogonal a Q, Q es ortogonal a P. 

Para quí unas aplicaciones proyectos 29 y Q ón ortogonales es necesario 
y suficiente que sean ortogonales los subespacios correspondientes Y y B. 

Sea .PQ=6; entonces para «EA y DEB tenemos 


(a, b)= (aP, 6Q)=(0.P0, b)=0, 


es decir, A es ortogonal a 9. Reciprocamente, si A es ortogonal a M, tenemos 
para cualquier vector x de Y 


PEA (PA= PQ =O y PR=6 
que es lo que se quería demostrar. 

Para el estudio detallado de las propiedades de las aplicaciones líneales 
suelen empleorse las representaciones matriciales de las mismos. Pero si Ja re. 
presentación matricial es, por cualquier razón, incómoda, se trata de expresar la 
aplicación lineal dada mediante aplicacionas de carácter más simple. En el caso 
de las aplicaciones normales, para estos aplicaciones elementales se pueden 
tomar las aplicaciones proyectivas. 

Una descomposición de tipo 


AAPP ARPA Ps (23) 
se llama descomposición espectral de la aplicación A, si 
a) los números dy, ..., « son diferentes; 


b) Pi=P/%0 (=l, 2, 


o PeP i=l 2, 
907Pr=6 (+h j, k=l, 2, 
E) PAPA APR 


Las condiciones b), c) y d) significan que P, DPs son aplicaciones 
proyectivas recíprocamente ortogonales. 

Está claro que silo Jos aplicaciones normales admiten la descomposición es- 
pectral. Efectivamente, de (23) se deduce: 


AAPP APA AP 
AN =D YP) ERPE SR do 

Reciprocamente, foda aplicación normal de un espacio unitario compleja 
admite una descomposición espectral. 

Sea A una aplicación normal de un espacio unitario complejo %. Hemos 
visto que en £ existe una base ortonormal €,, es, ..., e, formada por los vec- 
lores propios de la aplicación „€. Ordenemos “estos vectores de manera que 
aquellos que corresponden a valores propios iguales se encuentren al lado. $u- 
pongamos, por ejemplo, que ej, ..., €m, corresponden al valor propio æy, que 
Emi <-s en, corresponden al valor” propio az, ete. Indiquemos por 2 el 
subespacio tendido sobre los vectores em ,+1, ===» em, Correspondientes: al 
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valor propio a; (i=1,2, ..., s). Puesto que todos los vectores coordenados 
de &; son vectores propios correspondientes a un mismo valor propio ay, todos 
los vectores de Ñ; serán vectores propios con valores propios iguales a œp. Te- 
nemos 

Ll HRH. Hee (24) 


donde los subespacios L,, ..., £s son reciprocamente ortogonales, Indiquemos 
or P le aplicación de proyección sobre el subespacio E. „Pero la ortogona: 
idad de los subespacios €, implica la ortogonalidad de las correspondientes 
aplicaciones proyectivas. Además, de la igualdad (24) se deduce que P, + P+ 
+. 42 $ donde .P es la proyección sobre &. Como la proyección 
sobre Y es la aplicación idéntica, tenemos 


ESPADA AP (25) 


Vemos, por consiguiente, que las aplicaciones Py, . poseen las propie- 
dades de 0) ao) Proben linalmente que cda Pe 


AA PAPA 

Seo a un vector cualquiera de £. De la Igualdad (25) resulta 

ama Pita Ph HPs (26) 
El vector aP; pertenece a &; y todos los vectores de £; son vectores propios 
correspondientes al valor propio æj; por ello aPil =a; aP; Multiplicando 
(25) por Al, obtenemos 

ada PH Pm PAP 

de ens AUP +. pas Ps que es lo que se quería demostrar, 


AAA PA AP en 
es una descomposición espectral de una aplicación A, entonces y, ..., 34 es el 
conjunto de todos los valores propios de esta aplicación. 

En electo, cualquier aplicación „Py es, por hipótesis, diferente de la apli- 
cación G. Por consiguiente, existe un vector a tal que aP; +o. Pero como 
las aplicaciones „Pi, +... <P, son ortogonales, obtenemos entonces 


aP A= PP +a P Pait AP POR pp 


es decir, aP; es un vector propio correspondiente al valor propio ay. 
Reciprocamente, sea a un vector propio no nulo de la aplicación „£ corres- 
pondiente al valor propio B. De la propiedad e) se deduce que 


aa APA Ha P (28) 


La condición (27) da: 
almana P Ha Ph haa), 
Puesto que ayl =fa, tenemos 
Pit. Haa P =P H HPs. 


Multiplicando esta relación por P y empleando tas propiedaaes c) y d) en- 


contramos 
aa =p, y Ba Pj= =h, .... 8) 


El vector a es diferente de cero y por ello al menos un sumando «Py de (28) 
es también diferente de cero. Pero de la igualdad (a,—$)a.Py=0 resulta en- 
tonces P=a, que es lo que se quería demostrar. 
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o Sila P, +... +a P, es una descomposición espectral de una aplica- 
ción A y si ¡0)=B0+BME-+BnA” es un polinomio cualquiera, se tene 


HA =Ha) Pit + Mas) Ps. (29) 
Tenemos 


Multiplicando estas igualdades por los números Bo, By, 
mente, y sumándolas obtenemos la relación requerida 


AA PARRA AP 
es una descomposición espectral de una aplicación A, se tiene 


En efecto, consideremos el polinomio 
(Aa) A Ame o 
(0) + (21) (0/0 41) > 
De acuerdo con (29) tenemos 
Pi D= Pi a) Pra) Pat Ha) Pe 
Pero p; (ap)=0 (E )) y qe pt por consiguiente, Qi (vl) =P. 


La última propiedad significa que toda aplicación normal de un espacio uni- 
tario admile una descomposición espectral, p sólo una, 
a 


wae 


Efectivameni 
r ello sólo se 


Indiquemos algunas otras propiedades de las descomposiciones espectrales. 
El conjunto de los coeficientes ay, .... a, de la descomposición espectral se 
denomina espectro de la misma. Se llama espectro de una aplicación. lineal el 
espectro de su descomposición espectral. Hemos demostrado anteriormente que 
el espectro de una aplicación normal coincide con el conjunto de sus valores 
ropios. 

PU para que una aplicación, normal sea simétrica, respectivamente antisimétrica 
o unitaria, es necesario y suficiente que su espectro sea real, respectivamente ima. 
ginario puro o formado por números de módulo unidad. 

Sea da Pi+a Pot: Has P, la descomposición espectral de la 
aplicación „4. Tenemos “entonces que == P, +0 Pat ba), es la 
descomposición espectral de Ja aplicación eS, ES “que toda R 
normal admite sólo una descomposición espectral, resulta que la Condición 
dis” equivale a las igualdades asa; (i= 1, <- 9), es decir, equivale a 
que el espectro sea real. Hemos demostrado la primera alirmación. Las otras 
los se demuestran análogamente. 
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Ejemplos y problemas 


1. Descompóngase en parte simétrica y antisimétrica las matrices 


270 010 —1 2—7 
622|, |400| y 4-24 
205 009 4.4 2 


y hállense tas descomposiciones polares de las mismas. 

2. Sea £ un espacio euclideo de dos dimensiones y sea 4 una aplicación 
lineal del mismo que tiene dos vectores propios unitarios no ortogonales a; y 
az correspondientes a los valores propios œ, y % (a, # æ). Háilese la descom- 
posición polar de la aplicación A, si (a, a) =c0s p, donde p es un valor dado. 

3, Indíquese el enunciado matricial de la aplicación de Cayley (teoremas 
2 y3). 

4. Demuéstrese que toda matriz ortogonal U de orden tres, que no contiene 
la unidad entre sus valores propios, es de la forma 


TENN. Epa poa se eTA | 
TA Ca eta) ama)" 


5. Las matrices cuadradas complejas de orden n forman, respecto a las 
operaciones de adición y de multiplicación por número, un espacio lineal £ de 
dimensión n? Las matrices Eyy, en la i-ésima lila y jésima columna de las 
cuales aparece Ta unidad, mientras que en las demás posiciones aparece el cero, 
constituyen una base del espacio £. Hagamos cl espacio £ unitario, aceptando 
que las matrices Ei ofrecen una, base ortonormal en E. es decir, aceptando que 
el producto escalar de dos matrices A y B se calcula mediante la fórmula 
(A, B)= Y) a;¡Byy, donde œ; son los elementos de la matriz A y Biy son los 
elementos de la matriz B. La multiplicación de todas las matrices de & por 
una matriz cualquiera X a la derecha ofrece una aplicación lineal, del espacio &. 
Demuéstrese que: 

a) las matrices unitarias tienen en £ la longitud igual a Wa; 

b) las multiplicaciones por matrices conjugadas transpuestas X y X’ origi- 
nan en € aplicaciones conjugadas; 

e) la multiplicación de las motrices de @ por una matriz unitaria origina 
en E una aplicación unitaria: 

d) la multiplicación por una matriz hermitiana origina en Q una aplicación 
simétrica, mientras que la multiplicación por una matriz hermitiana antisimé- 
trica origina una aplicación antisimétrica. 

6. Demuéstrese que la suma de dos aplicaciones proyectivas Py y Pa es 
una aplicación proyectiva cuando, y sólo cuando, Pa Py =6. Además, en este 
caso Pa t Pam Pare 

7. El producto de dos aplicaciones proyectivas Py y Pa es una aplica- 
clón proyectiva cuando, y sólo cuando, Pa y Pa conmutan. Además, en este 
caso Pa Po = Papo 

8. Un subespacio Y está contenido en otro Y cuando, y sólo cuando, Py Py= 
SPa 

9. Demuéstrese la tórmula P, =$ Py 


10. Un subespacio Y es invariante respecto a una aplicación arbitraria 4 
cuando, y sóto cuando, la correspondiente aplicación proyectiva P =P Veri- 


Tica la relación PAP = PA. 
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11. Si las aplicaciones Æ y B con las descomposiciones espectrales vf = 
BaP) y B=D Bk conmutan, toda aplicación ¿Py es conmutable con 
cu: qu er aplicación Da. 

2. 


Si una aplicación normal £ conmuta con cualquier aplicación linea! B, 
la aplicación 4 conmuta también con 9°. 


13. Toda aplicación unitaria % de un espacio unitario complejo puede ser 
representada en la forma U=e"%, donde 4 es una aplicación simétrica. Reci- 


procamente, la aplicación e™%es unitaria cualquiera que sea la aplicación si- 
métrica 4. 


Capítulo VI Formas bilineales 
y Cuadráticas 


Se supone que todos los espacios que aparecen en este capítulo 
son espacios sobre un cuerpo conmuta.ivo (pero no sobre un cuerpo. 
cualquiera). 


$ 21. Formas bilineales 


21.1. Transiormación de formas. Un polinomio F (E) en las varia- 


bles $i, , E, con coeficientes de un cuerpo conmutativo K se 
llama forma de grado p-ésimo sobre K en E,, ..., En, si todos los 
términos de F son de un mismo grado p respecto al conjunto de 
las variables, Se llaman lineales las formas de primer grado, cua- 
dráticas las de segundo grado, cúbicas las de tercer grado, etc. 

Los problemas principales de la teoría de las formas son el pro- 
blema del estudio de las leyes de variación de los coeficientes de 
las formas en las transformaciones lineales de las variables y el 
problema de la búsqueda de los tipos elementales a los que pueden 
ser reducidas las formas mediante estas transformaciones. ' 

A veces, en lugar de una forma se considera un par de formas 
en las mismas variables y se plantea el problema de determinar una 
transformacion de las variables en la que ambas formas tomen la 
forma más sencilla posible. Este es el problema de un par de for- 
mas. Se pueden plantear problemas sobre ternas de formas, etc. 

Al final de este capítulo daremos la interpretación geométrica 
del problema de transformación de formas, mientras que primero 
consideraremos el problema desde el punto de vista algebraico y 


daremos su solución para el caso de formas cuadráticas. 
Escribiremos las fórmulas que relacionan las variables E,, ..., En 
con las variables nuevas $i, ..., E, en la forma 


ESE HEmy + Ey (el, 2... n) 0) 
de acuerdo con el punto 5.1. 
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Supondremos siempre que la matriz T=||t;;|| es invertible asi 
que las relaciones (1) permiten siempre expresar las variables nue- 
vas en términos de las antiguas. La matriz T se llama matriz de 
transformación de las variables E, en las variables Ej. 

En general, las formas dadas suelen transformarse paulatinamente: 
primero se introducen unas variables nuevas mediante las fórmu- 
las (1), después mediante fórmulas análogas se introducen en lugar 
de E; unas variables E;, etc. Sea T=T, la matriz de la transfor- 
mación de las variables E en las variables E”, sea 7, la matriz de 
la transformación de E' en E”, etc. Introduciendo en las fórmulas (1) 
en lugar de E/ sus expresiones en términos de Ej, expresaremos las 
variables E, linealmente en términos de Ej. Los cálculos directos 
muestran que la matriz de la transformación de E en E” es TaT, 
(compárese con el p. 5.1). Aplicando este resultado varias veces, 
llegamos a la conclusión siguiente: si a la transformación de las 
variables E en las variables E” le corresponde la matriz T,, si a la 
transformación de ¥ en E” le corresponde la matriz T,, ett., enton- 
ces a la transformación resultante de las variables E en las variables 
E le corresponde la matriz igual al producto TaTm=, --. T,T, de 
las matrices de las transformaciones intermedias. 

Supongamos, por ejemplo, que debemos reducir a la forma ele- 
mental lá forma cuadrática 


F=f 25,5, —2E 5, +1 


Tenemos 
F= (E — ba — Ea)’ —E3 + 858 yo 
Introduciendo las variables nuevas 
5= 4-58) E=b y Gsis, 


obtenemos 
F' E — Ep BES = bit — (Es — 4E) H 168°. 
La transformación 
b= E=E-45 y E=4E 
reduce la forma F a la forma elemental 
PEER ES. 
Según la regla expuesta, la matriz de la transformación de E” en ¿ es 


100 1 00 1 00 
=110 0 10|=|—1 10]. 
—1 01 0—44 =1 —4 4 
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Como segundo ejemplo consideremos el problema general de trans- 
formación de un sistema arbitrario de m formas lineales 
LE Esa + H Eto ) 


(2) 


en n variables. La matriz A=||a,,I|, que para m&n resulta rec- 
tangular, se llama matriz de este sistema. Introduciendo en las 
formas dadas en lugar de las variables E, sus expresiones en térmi- 
nos de Ej definidas por (1), obtenemos un sistema de m formas 
lineales en las variables muevas Ej. El cálculo directo muestra que 
la matriz A, del sistema nuevo está ligada a la matriz A del si- 
stema antiguo mediante la relación 
A,=TA, 

es decir, al pasar a las variables nuevas la matriz de un sistema de 
formas lineales se multiplica a la izquierda por la matriz de la trans- 
formación. 

Para reducir el sistema (2) a la forma elemental escojamos entre 
las formas fy, a 0, fa En +: -, En las n primeras linealmente inde- 
pendientes. Sean éstas las formas fu, ..., fino Buas, oo, En. Es 
evidente que el número r es igual al rango de la matriz A. Pode- 
mos introducir en lugar de E, ..., E, unas variables &; tomando 


bim h E) oee CIS TO 4 
y después de ello el sistema dado (2) tomará la forma elemental 


requerida 
b o Bh Fir eee Fas 


donde fisa, ..., fm son unas formas lineales en gi, ..., Es. En 
particular, si todas las formas iniciales eran linealmente indepen- 
dientes, la transformación de variables señalada las reducirá a la 
forma canónica fi m i 


E T Ea 


21.2. Equivalencia de formas bilineales. Frecuentemente en lu- 
gar de Tos polinomios en un sistema de variables £,, ..., E, se con- 
sideran los polinomios en dos sistemas de variables, por ejemplo, 
En 200) En Y Ma +», Nn así como los polinomios en varios sistemas 
de variables. Un polinomio en varios sistemas de variables se ilama 
forma si es homogéneo respecto a cada uno de los sistemas de va- 
riables por separado. Son de un interés especial las formas lineales 
respecto a cada uno de los sistemas de variables. Estas formas se 
llaman bilineales, si hay dos sistemas de variables, trilineales, si 
hay tres sistemas, y polineales en el caso general. 

El número de variables de cada uno de los sistemas puede ser 
distinto. El problema de transformación de formas de varios siste- 
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mas de variables puede plantearse en diferentes aspectos, ya que 
se puede someter a una transformación lineal cada uno de los siste- 
mas de variables independientemente de las transiormaciones de los 
restantes sistemas y se puede también realizar con cada uno de 
estos sistemas transformaciones que estén ligadas entre si de algún 
modo. 

Se llaman equivalentes las formas que pueden ser reducidas una 
a otra mediante una selección independiente de transformaciones 
lineales de las variables. En cambio, se dice que las formas son 
congruentes, si todos los sistemas de variables contienen un mismo 
número de variables y las formas de estos sistemas pueden ser re- 
ducidas una a otra mediante transformaciones lineales—de una misma 
matriz—de cada uno de los sistemas. Está claro que las formas con- 
gruentes son siempre equivalentes. La recíproca, por supuesto, no 
tiene lugar en el caso general. Es fácil dar ejemplos de formas 
equivalentes que no son congruentes limitándose incluso al caso de 
formas bilineales. En este punto consideraremos el problema ele- 
mental de equivalencia de formas bilineales y en el punto siguiente 
examinaremos el problema sobre la congruencia de formas bilineales 
simétricas. 

Una forma bilineal en dos sistemas de variables E,, ..., E, y 
Ma» -++ Mn es de la forma 

Faak (i i=1, 2, ..., n) 

La matriz A=/|x,,]] formada por los coeficientes de la forma se 


lioma matriz de la forma y el rango de la matriz A se llama rango 
de la forma. 


Introduciendo las matrices de una fila 
X=lEr 20. En] e Y=[M o Ma)» 
podemos representar la forma F de modo siguiente 
F=XAY". (3) 
Supongamos ahora que debemos pasar de las variables E y n a 


unas variables nuevas E” y w’ ligadas a las antiguas mediante las 
fórmulas 


ESE Et) y meLio 
o empleando la notación matricial 


X=XT e Y=YS, (C 
donde T=/|+,¿ll, S=lo;l] y 
X= lbs En] € Y=, ---, mi). 


Introduciendo en (3) las expresiones (4) para X e Y, obtenemos 
F=X TASY¡=XAYi, 

donde A, es la matriz de la forma transformada. 

17— 1843 
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Por consiguiente, si en una forma bilineal de matriz A se realiza 
una transformación de matriz T del primer sistema de variables y 
una transformación de matriz S del segundo sistema de variables, 
se obtiene una forma bilineal de matriz 


A, =TAS'. (5) 


Hemos explicado ya que las formas bilineales que se obtienen 
una de otra mediante transformaciones lineales de fas variables se 
llaman equivalentes. Por otra parte, según el p.13,4 unas matrices 
A y A, se llaman equivalentes sobre un cuerpo conmutativo K, si 
existen” unas matrices regulares P y Q formadas por elementos de 
K tales que A,=PAQ. Comparando con la fórmula (5), vemos que 
para la equivalencia de unas formas bilineales sobre un cuerpo con- 
mutativo arbitrario K es necesario y suficiente que sus matrices sean 
equivalentes. 

Según el p. 13.4, todas las matrices cuadradas de un orden dado 
n y de un rango dado r son equivalentes entre sí sobre el cuerpo 
conmutativo K y son equivalentes a una matriz de tipo £,+0,,_.., 
donde E, es la matriz unidad de orden r y O,.., es la matriz nula 
de orden n—r. Aplicando esto a las formas bilineales obtenemos el 
siguiente resultado que resuelve totalmente el problema de equiva- 
lencia de las formas bilineales: 

Para la equivalencia de unas formas bilineales sobre un cuerpo 
conmutativo arbitrario es necesario y suficiente que coincidan los ór- 
denes y los rangos respectivos de las matrices de estas formas. 

Las formas de determinante diferente de cero se llaman regulares 

las demás se llaman singulares, El resultado obtenido acerca de 
a equivalencia de formas significa que todas las formas bilineales 
regulares en sistemas de n variables son equivalentes a la forma 


Em á+H EM >> + Etoo 
miera que todas las formas singulares son equivalentes a formas 
e tipo 
bmtint -+E  (1=0,1,2,...,2—1), 

donde r es el rango de la forma. 

Si el campo principal es el cuerpo de los números complejos, 
suelen considerarse, además de las formas bilineales corrientes, las 
formas de Hermite, es decir, las formas de tipo 


F=20,Emp 
donde la raya superior significa que se pasa a los valores conjuga- 
dos. La notación matricial de una forma bilineal hermitiana de 
matriz A= |a|} es 


F=XAY”, 
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y la matriz A, de la forma hermitiana nueva que resulta de F al 
realizar la transformación (4) de las variables es igual a 


A,=TAS'. (6) 
De aquí obtenemos, al igual que antes, que todas las formas 
bilineales hermitianas en sistemas de n variables son equivalentes a la 
forma B T 
Em Him +... HE 
donde r es el rango de la forma dada. 


21.3. Congruencia de formas bilineales simétricas. Hemos seña- 
lado anteriormente que las formas bilineales en dos sistemas com- 
puestos por un mismo número de variables se llaman congruentes 
si se obtienen una de otra mediante transformaciones lineales de 
matrices idénticas de ambos sistemas. 

Tomando S=7 en la fórmula (5), llegamos a la conclusión de 
que al someter ambos sistemas de variables de una forma bilineal de 
matriz A a una transformación lineal de matriz T, la matriz de la 
forma nueva será 

A,=TAT", l 


Unas matrices A y A, se llaman congruentes, si están ligadas 
por una relación de tipo (7), donde T es una matriz regular ade- 
cuada. Por consiguiente, las formas bilineales son congruentes si, y 
sólo si, son congruentes sus matrices. 

Una forma bilineal cuya matriz es simétrica o antisimétrica 
también se llama simétrica o antisimétrica, respectivamente. 

Si una forma bilineal dada es simétrica o antisimétrica, la misma 
propiedad tendrán todas las formas congruentes. 

Efectivamente si A’= 4 A, de (7) resulta 


A= TAT = t A, 
Considerando análogamente las formas bilineales hermitianes, ob- 
tenemos de (6) que la matriz A, de la forma hermitiana nueva que 


resulta al aplicar a la forma de matriz A una transformación lineal 
de matriz T de ambos sistemas de variables es igual a 
A,=TAT. (8) 

Unas matrices A y A, se llaman hermifianas congruentes, si 
están ligadas por la relación (8) mediante una matriz regular T. 
Por lo tanto, la congruencia de las formas hermitianas equivale a 
la congruencia de hermitiana sus matrices. 

Una forma hermitiana se llama simétrica si su matriz es hermi- 
tiana simétrica, es decir, si A'=A. De (8) se desprende directa- 
mente que si una forma hermitiana dada es simétrica, todas las 
formas congruentes de la misma son también simétricas. 


17. 
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Puesto que Ja congruencia de matrices implica la equivalencia 
de las mismas, para la congruencia de unas formas es necesario que 
coincidan sus rangos. Sin embargo, esta condición no es suficiente, 
Las condiciones suficientes en el caso más general serán examinadas 
en el p. 23.3; ahora daremos estas condiciones para los casos más 
importantes solamente. 

Sea, ante todo, K el cuerpo de los números reales y sea A una 
matriz simétrica. Existe entonces, de acuerdo con el p. 19.4, una 
matriz unitaria real U tal que la matriz A,=UAU”! tendrá la 
forma diagonal, Pero si U es unitaria, tenemos UU’ =E, de donde, 
debido a que las matrices son reales, se deduce que U-1=U”, es 
decir, A,=UAU”. Por consiguiente, A es congruente de una matriz 
diagonal A,. Luego, hemos demostrado el teorema siguiente: 

TEOREMA 1. Toda forma bilineal simétrica real puede ser reducida, 
mediante una adecuada transformación unitaria real de las variables, 
a la forma 


AE +++. 0,5), (9) 


donde r es el rango de la forma y a, ..., a, son los números 
característicos diferentes de cero de la matriz de la forma. En par- 
ticular, para la equivalencia unitaria de unas formas bilineales 
simétricas reales es necesario y suficiente que coincidan los polinomios 
característicos de las matrices de las formas. 

Este teorema de más de lo que pretendíamos obtener, Significa 
que la reducción a la forma diagonal se puede alcanzar mediante 
una transformación unitaria real de las variables. Si no es necesario 
que la transformación de las variables sea unitaria, podemos conti- 
nuar la reducción a la forma elemental. Es decir, supongamos que 
hemos reducido ya la forma al tipo diagonal (9). Cambiemos ahora 
la numeración de las variables de manera que primero aparezcan 
los términos de coeficientes positivos y después los de coeficientes 
negativos. Supongamos, por ejemplo, que œ, ..., Œ, son positivos 
Y QUe Ay, +-+, % son negativos, Tomando entonces 


E=Val) =V =l, a) 

“=V >an m=V—=2mM (k=s+l, r), 
podemos reducir la forma dada a la forma 

bimi Himi Emi — «+ — En (10) 
La diferencia 
o=s—(r—s)=2s—r 

se llama signatura de la forma (10). Es evidente que la forma (10) 
se determina totalmente por su rango y su signatura, ya que 
s=4 (0+7). El hecho de que la signatura no depende de cómo se 
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reduce la forma dada a la forma (10) y, por consiguiente, se deter- 
mina univocamente por la forma inicial, constituye el contenido de 
la asi Memaga ley de inercia que será examinada detalladamente en 
el p. 22.3. 

Para las formas simétricas hermitianas la situación es totalmente 
análoga. Sea F una forma hermitiana de matriz hermitiana simé- 
trica A. De acuerdo con el teorema 4a (p.19.4), existe una matriz 
unitaria U tal que la matriz A, =UAU”! será diagonal real. Como 
U es unitaria, tenemos U“*=0*, de donde A,=UAU". Hemos 
demostrado, pues, el siguiente teorema: 

TEOREMA 2. Toda forma bilineal hermitiana simétrica puede ser 
reducida, mediante una transformación unitaria de las variables, a la 
forma diagonal 


aM Haa -o HE 


con coeficientes reales. Los valores a,, ..., œ, son las raices diferentes 
de cero del polinomio caracteristico de la matriz de la forma y por 
ello para la congruencia unitaria de las formas hermitianas simétricas 
es necesario y suficiente que coincidan los polinomios caracteristicos 
de estas formas. 

Si en lugar de la congruencia unitaria se considera la congruencia 
respecto a transformaciones lineales arbitrarias, el proceso de reduc- 
ción de una forma pee ser continuado como ha sido señalado 
anteriormente y así obtendremos una forma de tipo 


EMH o HET Erie — e E an) 
Toda forma hermitiana simétrica puede ser reducida, por consiguien- 
te, a una de estas n-+1 formas (r=0, l, ..., n). Otra vez la 


no congruencia de las formas (11) para diferentes valores de s se 
desprende de la ley de inercia mencionada anteriormente. 


Ejemplos y problemas 


1. Demuéstrese que el sistema de formas lineales en E, Em En y Es 
Eitte Batto Bsti y Saba 


es equivalente al sistema 


tittat to batis tbn ob y itis 
y no es equivalente al sistema 


fimietto rtis—to Bits y ittir 
2. Demuéstrese que un sistema de formas lineales 
A NAS (12) 
es equivalente a otro sistema 


abit bon 


heces 89 a3) 
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cuando, y sólo cuando, el sistema de vectores 


a=[01 Oz anl (=l, m) (14) 


del espacio lineal de los vectores filas puede ser convertido, mediante una 
adecuada transformación lineal regular de este espacio, en el sistema de vectores 


bi= Bars Bar.» Bal CS1, +... mm). (15) 


3, Demuéstrese, que el sistema de formas lineales (12) puede ser reducido, 
mediante una transformación unitaria de las variables, en el sistema (13) cuando, 

sólo cuando, el sistema de vectores (14) del espacio unitario de filas puede 
Ser convertido, mediante una adecuada aplicación unitaria de este espacio, en 
el sistema de vectores (15). 

Demuéstrese que para la equivalencia de formas bilingales en sistemas 
que contienen diferente número de variables es necesario y suficiente que coin- 
cidan las dimensiones (es decir, el número de filas y el número de columnas) 
y los rangos de las matrices de las formas. En particular, las formas bilineales 
en dos sistemas de variables Es, .... En Y Mi -s Ma (n>m) de rango r son 
equivalentes a la forma EP... + EM 
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22.1. Congruencia. Según la definición general, una forma cua- 
dráfica en las variables E,, ..., E, es un polinomio homogéneo de 
segundo grado en estas variables. Toda forma cuadrática en las 
variables indicadas puede ser representada univocamente en la si- 
guiente forma simétrica 

F= Dakt, (04,4). (1 


La matriz A= layl] se llama matriz de la forma cvadrático'y 
la forma bilincal siméfric 


FE, y=Ya£m, 


en dos sistemas de variables, que tiene la misma matriz que'la 
forma cuadrática, se llama forma polar de esta última. Identificando 
en la forma polar el primero y el segundo sistemas de variables 
obtenemos la forma cuadrática inicial. Así se establece una co- 
rrespondencia biyectiva entre las formas cuadráticas y las formas 
bilineales simétricas. Por ejemplo, si 


FE =E E H kE 
la notación simétrica de F (E) es 


FO=0-8+Í50 HEt — tt — 3t 


y la forma polar correspondiente es 


Gbin 


FE w= im—im + fim Hi in — Ban — E 
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Se dice que una forma cuadrática es diagonal si su matriz es 
diagonal, es decir, si la forma contiene sólo términos con los cua- 
drados de las variables. 

Realizando en la forma (1) una transformación lineal de las va- 
riables de matriz T, obtendremos una forma nueva (p. 21.1) 


F(E)=XAX'=XTAT'X; 
(X= fks] y Xs -.-, ED 


A,=TAT. 


de matriz 


Por consiguiente, la ley de variación de la matriz de una forma 
cuadrática es la misma que para la correspondiente forma bilineal 
polar. De aquí se deduce que unas formas cuadráticas son congruen- 
tes cuando, y sólo cuando, son congruentes las correspondientes 
formas polares y del teorema 1 del parágraio anterior obtenemos 
directamente el teorema siguiente: 

TEOREMA 1. Todo forma cuadrática real puede ser reducida median- 
te una adecuada transformación ortogonal real de las variables, a 
la forma diagonal 


aida... +0, (2) 


donde r es el rango de la forma inicial y œ, ..., a, son los núme- 
ros característicos diferentes de cero de la matriz de la forma. En 
particular, para la congruencia ortogonal de unas formas cuadráticas 
reales es necesario y suficiente que coincidan los polinomios caracte- 
rísticos de las formas. 

Si se aceptan también transformaciones no ortogonales de las 
variables, es posible continuar la reducción: si %,, ..., Œ, SON po- 
sitivos y %;+,, -.., a, Son negativos, la forma (2) se reduce median- 
te la sustitución 


=V antn y =V Ta 8 i=l, ....5i I=s+1,....0) (8) 
a la forma o es 5 
EA ES EA — E, 

Por consiguiente, a esta forma puede ser reducida, sobre el cuerpo 

de los números reales, cualquier forma cuadrática. El caso de otros 


cuerpos conmutativos será considerado en el punto siguiente. 
Una expresión de tipo 


FEO)=2 0 E XAR (X= ën ...,E1)), 

donde a;¿=4%y (i, f=1, , 1), se llama forma cuadrática hermi- 
tiana en las variables E,, ..., E, de matriz A= ||æ;|]. La forma 
bilineal simétrica hermitiana F (E, DA cul se lama forma po- 
lar de F (E). Las leyes de variación de las matrices de una forma 
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cuadrática hermitiana y de su forma polar coinciden. Por esto la 
congruencia de las formas cuadráticas hermitianas equivale a la 
congruencia de sus formas polares y del teorema sobre la reducción 
de formas bilineales simétricas hermitianas (p. 21.3) se deduce el 
teorema siguiente: 

TEOREMA 2. Toda forma cuadrática hermitiana puede ser reducida, 
mediante una transformación unitaria de las variables, a la forma 


aer. ab, (O) 
donde r es el rango y a, ..., œ, son los números característicos no 
nulos de la matriz de la forma dada. Para la congruencia unitaria 
de unas formas cuadráticas hermitianas es necesario y suficiente que 
coincidan los polinomios caracteristicos de las matrices de las formas.” 

Mediante una transformación ulterior de las variables de tipo (3), 
que ya no será unitaria, la forma (4) puede ser reducida a la forma 


Eh + T 
que es en este caso la elemental. 


22.2. Algoritmo de Lagrange. Uno de los métodos más simples 
de reducción de una forma cuadrática a la forma diagonal es el 
así llamado método de Lagrange que será considerado aquí. Se puede 


aceptar que el o principal es un cuerpo conmutativo cualquiera 
de característica diferente de 2. 

Supongamos que la forma (1) debe ser reducida a la forma dia- 
gonal. Pueden darse dos casos: a) la forma contiene el cuadrado 
de al menos una variable y b) la forma no contiene los cuadrados 
de las variables. 


a) Supongamos, por ejemplo, que æ, + 0. Representando la forma 
del modo siguiente 


F= angit 2 +. +20, 6 En + M: 2, A 
mai (>> + nn) — an (aht H 2 bs ++ +. 
Ri ma E 
PEE HF, las +++ En) 


donde F, es una forma cuadrática en $, . 


En, y realizando la 
sustitución 


Ei = ayibi F aba H > >> nba 
E=E (i=2, 3, ..., n), 
podemos reducir F a la forma 
F= 
donde F, no depende de Ej. 


+F, 
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b) Supongamos que æy=... =a, =0 y que, por ejemplo, 
dt, 7% 0. Representando la forma F del modo siguiente 


F=E (Ub pot) +F, Ea ++. + En) 
y realizando la transformación 


A 
Est (i=1,3,4,....m), 


obtenemos la forma 
EE AED 24255 + ota +... 
que contiene el cuadrado de la variable E;. 

Por consiguiente, aplicando el proceso a) y complementándolo, 
en los casos necesarios, con el proceso b) podemos reducir la forma 
dada a la forma diagonal. 

Ejemplo. Es necesario reducir a la forma diagonal la forma 

PEA ARHI — El — arba H Oita — 12 ba + Bote + Eo — Ela 

Tenemos 

PARE H Be H ats —E 
Realizando la transformación 


Em ts mb (>, 


obtenemos la forma 
A 
que mediante la transformación 
me mel (143 


=i EE 


se reduce a la forma 
Pa H —N Mo 
Ahora, de acuerdo con b), realizamos la transformación 
MEM wen (#4, 
obteniendo así la forma 
A a . q a A ALS E 
Fy=ni —m ++ ns) =n 0 (nitg q. 
Esta forma mediante la transiormación 
LATE Dr i , 
L=mM+G 06 =y (i=1, 3, 4), (=n 
se reduce a la forma diagonal 
2 ds 
F=+G-G-q 4 
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Para hallar la matriz T de la transformación de las variables £; en las va- 
riables iniciales Ey es suficiente, por lo visto en el p. 21.1, multiplicar las ma- 
trices de las transformaciones intermedias. 


` 

Si en vez de una forma cudrática es necesario reducir a ła forma 
diagonal una forma bilineal simétrica, sustituimos la forma bilineal 
por la cuadrática correspondiente, reducimos esta última a la forma 
diagonal y determinamos la matriz de la transformación. Debido a 
la relación que existe entre las formas cuadráticas y bilineales, esta 
transformación también reducirá a la forma diagonal la forma bili- 
neal dada. 

Para concluir, consideremos el problema sobre la reducción a la 
forma elemental de una forma bilineal antlsimétrica 


F=Ya km (y= an) 


cuyos coeficientes pertenecen a un cuerpo conmutativo cualquiera. 
Si todos los coeficientes son iguales a cero, la forma está ya 
reducida. En el caso contrario aceptaremos, por ejemplo, que «,, 34 0. 
Escribiendo la forma del modo siguiente 
FE (dodo > no) — N, (aaa H >> + H anën) + 
HR (Èa c++, Bnr Moo +++» M5) 


y realizando la sustitución 
Es ga o Maa + o Mas 
Est w= (=1,3, ...,1), 
obtenemos la forma 


EEm— Emb R, (Èis oes Em Mo eaa M5). 


Ahora pueden darse dos casos: a) el resto R, no contiene E; y, por 
consiguiente, tampoco contiene n, y b) el resto contiene Es. En el 
caso a) aplicamos el proceso solamente al resto, ya que éste no de- 
pende del término que hemos despejado gin, — im. En el caso 
b) representamos la forma del modo siguiente 


F= pim bini + E (am H o o + 

h (atst -e H inta) H R ( 
Ši — aias — ++ — En) Ni — 

— (0 — Ma — + — Mi) Es + Ra (Es, ++) 

y realizamos la sustitución 
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obteniendo como resultado la forma descompuesta 
tinitini + R, El + M5 +++). 


Aplicando el proceso expuesto al resto, después al resto nuevo, etc., 
reduciremos la forma a 


Er — EM + E m Es > + Era Mer — Barer- 


donde 2r es el rango de la forma reducida y, por consiguiente, 
también de la inicial, En particular, obtenemos de nuevo que el 
rango de una matriz antisimétrica es siempre un número par. 


Ejemplo. Redúzcase a la forma elemental la forma 


Pm im HEM — ii — B Ha HEN — Ba H 
Hemi — ima — ami H 4E. 
De acuerdo con la regla, realizamos la primera transiormación 


E=5+ Bo M= +09 —2Mas 
“=s w=n (=1,3, 4, 
después de la cual la forma se convierte en 
Ficti bini + Ens — aini Esni — Emi — En +A 
Realizando ahora la transformación 
t= n= —I5— Has 
U=Y mew ((=2,3, 4), 
obtenemos la forma elemental 
Pampin E + gins- 

Desde el punto de vista práctico el problema sobre la reducción 
de las formas cuadráticas a la forma elemental se descompone en 
dos momentos: la determinación de la forma elemental definitiva 
Y la determinación de, la matriz de la transformación de las varia- 

les necesaria para reducir la forma a la forma elemental. Si la 
reducción se realiza mediante transformaciones lineales arbitrarias, 
ambos problemas quedan resueltos al aplicar el algoritmo de 
Lagrange. 

La situación es más compleja si las formas se reducen mediante 
transformaciones unitarias de las variables. Sea dada una forma 
hermitiana de matriz A. En el espacio unitario auxiliar de vectores 
filas la multipticación de las filas por la matriz A representa una 
aplicación lineal simétrica 4 de matriz A en la base elemental 
(p. 4.1). Debemos determinar una base ortonormal en la que la 
matriz A de la aplicación sea de forma diagonal. Para ello halla- 
mos los números característicos œ, ..., a, de la matriz A que se 
obtienen resolviendo la ecuación característica de A. Después, 
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resolviendo el sistema de ecuaciones lineales 
Bn. En] 4=0, [En -o En] 


respecto a las incógnitas E,, ..., E,, encontramos n vectores pro- 
pios linealmente independiente 


x= (EP, E] (i=L ...,. 1) 


de la aplicación 4. Normalizando estos vectores, obtenemos una 
base ortonormal en la que la matriz A y, por consiguiente, la 
forma hermitiana inicial adquieren la forma diagonal con los ele- 
mentos diagonales œ, ..., Œp. Si los vectores x; son ya normali- 
zados, la matriz requerida de la transformación será T = ||§ ||. 


22.3. Ley de inercia de formas cuadráticas. En los resultados 
del p. 22.1. acerca de la reducción de formas cuadráticas reales, 
así como de formas hermitianas complejas, a la forma diagonal 
hemos dejado una laguna: no hemos aclarado si pueden ser congruen- 
ja formas de diferente signatura. El teorema que sigue llena esta 
laguna. y 

TEOREMA 3 pe de inercia). Toda forma cuadrática real puede ser 
reducida a la forma diagonal aEt+...-+0,E% mediante un número 
infinito de transformaciones de las variables. Sin embargo, aun cuando 
los propios coeficientes œ, ..., a, pueden depender de la transfor- 
mación que se emplee, el número de los coeficientes positivos y el 
número de los coeficientes negativos que aquí figuran no dependen 
de las transformaciones señaladas y, por consiguiente, se determinan 
univocamente por la propia forma inicial. 

Supongamos, al contrario, que una forma cuadrática real 


ait... aia Ima (9 > 0) 


se convierte, mediante la transformación de las variables Ẹ; = Byta, 
de nuevo en la forma diagonal 


BEH. E — BAS (B> 0), 
pero siendo s < t. Esto significa que la igualdad 
akit- Hatia ia. aki = 
SRE H. HBE — Binti BE 


se convierte en una identidad al sustituir las variables E, por sus 
expresiones en términos de las variables E;. Representemos esta 
identidad en la forma 


atit Pa Brit HBE = 

SREP.. HBE Harni. HoE 6) 
y consideremos el sistema de ecuaciones 

E=0, -a =O, gii=0, c, E450, ©) 
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donde por Ej, ...» Es se comprenden sus expresiones en términos 
de El, ..., Es. El sistema (6) es un sistema de ecuaciones lineales 
homogéneas respecto a las incógnitas Es, ..., Es, siendo el número 
de ecuaciones s+(2—1)=n—(1—s) indudablemente menor que el 
número de incógnitas, ya que f>s. Pero en estas condiciones el 
sistema (6) debe tener al menos una solución no nula 


ES Y > EL Yer Esas =0, +. ., En =0. (7) 
Introduciéndola en la identidad (5), obtenemos 

Bid FB 87=00. (8) 
Los números B, y «a, son positivos y los números y? y Ej son no 
negativos y por ello de (8) resulta que y,=...=Y,=0 lo que 


contradice a que la solución (7) es no trivial. 

La ley de inercia tiene lugar también, con el mismo enunciado, 
en el caso de formas cuadráticas hermitianas. La demostración no 
difiere de la que acabamos de realizar. 


22.4. Formas de signo constante. Una forma cuadrática real 
PE=S RE, se llama no negativa si su valor es no negativo 
cualesquiera que sean los valores reales de las variables Ey. La donne 
se llama definida positiva si su valor es estrictamente positivo para 
cualquier sistema no nulo de valores de las variables. Análogamente 
se introducen los conceptos de formas no positivas y de formas 
definidas negativas. Las formas mo negativas y no positivas se lla- 
man a veces formas de signo constante. 

Si una forma en n variables E,, E, es de forma diagonal 


abit... ari — + — 0% (a > 0), 


es fácil ver que será definida positiva cuando s=n, no negativa 
cuando s=r<n, no itiva cuando s=0 y definida negativa 
cuando s=0 y r=n. Siendo 0<s<r la forma puede tomar va- 
lores positivos para unos valores de las variables y valores negati- 
vos para otros valores de las variables. Puesto que la constancia 
de signo de una forma se conserva al realizar una transformación 
de las variables, se puede decir que son definidas positivas aquellas 
formas que se reducen a la suma de n cuadrados positivos y que 
son no negativas aquellas formas que se reducen a la suma de 
cuadrados positivos solamente, aunque sea en un número menor 
que el número de las variables; afirmaciones correspondientes tienen 
lugar para las formas no positivas y definidas negativas. En parti- 
la una forma no negativa es definida positiva sólo cuando es 
regular, a 

esi en las formas cuadráticas corrientes se permite que las va- 
riables tomen valores tanto reales como complejos, los conceptos 
introducidos pierden el sentido, ya que en este caso cualquier forma 
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no nula puede tomar valores no reales. La situación es distinta si 
se consideran formas hermitianas. La razón de esto estriba en que 
tanto para los valores reales como complejos de las variables las 
formas hermitianas toman siempre valores reales. Efectivamente, de 


las condiciones «,¿=% se deduce que 


F= Dati Datis Bakk F, 
es decir, se deduce que F es real. Por esto, los conceptos de forma 
no negativa, definida positiva, etc. se pueden extender directamente 
al caso de formas cuadráticas hermitianas, 

Es fácil establecer si una forma es definida positiva, así como 
determinar su signatura, reduciéndola a la forma diagonal por el 
método de Lagrange. Sin embargo, en determinados casos tienen 
gran interés los criterios directos de definición positiva. Entre estos 
nos limitaremos a exponer el así llamado criterio de Jacobi. 

CRITERIO DE JACOBI. Una forma cuadrática o cuadrática hermitiana 
en n variables de matriz A es no negativa cuando, y sólo cuando, 
los coeficientes del polinomio característico de A son de signos alter- 
nados. Además, si uno de estos coeficientes se anula, también resul- 
tan nulos todos los coeficientes de los términos de grado interior. 

Efectivamente, por lo visto en el p. 22.1, la forma dada puede 
ser reducida, mediante una transformación de las variables de matriz 
unitaria U, a la forma diagonal de matriz diagonal real A, =UA0U'= 
=UAU-1, Puesto que la matriz A, además de ser congruente, es 
también semejante de A,, el polinomio caracteristico de A coincide 
con el polinomio característico de A, y basta demostrar el criterio 
sólo en el caso de formas diagonales de tipo «EE, +... +08. 
El polinomio característico de esta última matriz es 


PA= A—a) A— a). . (A) = ÑO An O An, 
Si todos los a, son positivos, las fórmulas de Vieta 


=LA Ln, -An (m <n <. Ln) 

muestran que los coeficientes de p (2) poseen la propiedad requerida. 
Recíprocamente, supongamos que los coeficientes de un polinomio 
son diferentes de cero y tienen signos alternados y supongamos que 
las raíces del polinomio son reales. Debemos demostrar que todas 
sus raíces son positivas, Supongamos, por inducción, que esto ha 
quedado ya demostrado para todos los polinomios de grado inferior. 

tonces q'(A) tendrá n—1 raíces positivas qa ue si todas las 
condiciones indicadas se cumplen para p(»), 'ambién se cumplen 
indudablemente para q'(A)). Pero en este caso (à. tiene, según el 
teorema de Rolle,“no menos de n—1 raíces posit vas y la última 
raíz n-ésima de (A) será positiva debido a que el producto de 
todas las raíces de p(A) es, por hipótesis, positivo 
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Ejemplos y problemas 
1. Hállese la matriz de la transformación lineal de las variables que reduce 
ta forma bilineal 
Erna — Eana Esa — Esa +E — Bm 


a la forma elemental. 

2. Demuéstrese que sobre un espasio unitario real toda forma bilineal anti- 
simétrica real en n variables puede ser reducida, mediante una transformación 
unitaria real de las variables, a 


y EMO +- + Har sr Mor 
(compárese con el p. 19.5). 
, Hállense las matrices de las transformaciones ortogonales reales de las 
variables que reducen a la forma diagonal las formas 
a) BE-Hbiga + Ed: 
b) 995% — 12515, + 485,Es -H 13053 —G0E/Es +7183; 
C) 1OB701 + 4EaNa + Aa + 12Na H 12551 — Eana — Mismo — 1M4Eote H Ea 


y dotermínense estas formas elementales. 
4. Hállese la matriz de la transformación unitaria que reduce la forma 


ima — Slam -H ana — anhi + Bana — Bana — Sis + Gaa 


a la forma elemental. 
5. Hállese la transformación de las variables que reduce la forma 


Ati Hr (53) 


a la suma de cuadrados. 


Earner- 
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23.1. Equivalencia de pares de formas. En los puntos anteriores 
hemos examinado el problema sobre la reducción a la forma ele- 
mental de una forma cuadrática, En este parrágrafo será considerado 
el problema importante acerca de la reducción simultánea de dos 
formas cuadráticas. 

Recordemos que una sucesión de formas bilineales Fy, ..., Fp 
en los mismos sistemas de variables E,, ..., Y Y» 
llama equivalente a una sucesión de formas bilineales G,, ... 
en las variables Es, ..., Es Y Mi, ..., n4 si mediante unas trans- 
formaciones lineales invertibles de las variables 


(El =[8]7, [ni=[JS (E= Bo ..-, En)) 


las formas de la primera sucesión pueden ser reducidas a las formas 
correspondientes de la segunda sucesión. 

De fos resultados del p. 21.2 se deduce que una sucesión de 
formas bilineales de matrices Aj, ..., A, es equivalente a una 
sucesión de formas bilineales de matrices By B, cuando, 
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y sólo cuando, existen unas matrices regulares P y Q con elementos 
del campo principal tales que 
PAQ =B, (i=1,.. , k). (1) 

Dos sucesiones de matrices Ay, ..., Az Y By...) By se llaman 
equivalentes si están ligadas por las relaciones (1), donde P y Q 
son unas matrices regulares. Por consiguiente, la equivalencia de 
unas sucesiones de formas y la equivalencia de las sucesiones de 
sus matrices son conceptos que tienen el mismo sentido. 

Sea à una variable independiente y sea F y G un par de mat- 
rices cuadradas de un mismo orden n. Los factores invariantes de 
la A-matriz AF —G (véase el p. 13.2) se llaman factores invariantes 
del par F y G. Si el par F y G es equivalente al par F, y G,, 


de (1) resulta 
AF,—G, =U (AP —G)V". 

Por lo visto en el p. 13.3 esto significa que los factores invarian- 
tes de las A-matrices AF,—G, y AF—G coinciden. Es decir, para 
la equivalencia de dos pares de matrices es necesario que coincidan 
los factores invariantes de estos pares. En el caso general esta con- 
dición no es suficiente". Sin embargo, si las primeras matrices de 
ambos pares son regulares, la coincidencia de los factores invarian- 
tes es suficiente para que estos pares sean equivalentes. 

TEOREMA 1. Sean dados dos pares de matrices cuadradas F, G y 
F,, G, de un mismo orden y sean F y F, regulares. Para la equiva- 
lencia de los pares F, G y F,, G, es necesario y suficiente que los 
factores invariantes de la matriz AF—G coincidan con los factores 
invariantes de ía matriz »F,—G,. 

La necesidad ha sido ya demostrada y, por ello, estableceremos 
solamente la suficiencia. Supongamos que los factores invariantes 
de las matrices AF—G y AF,—G, coinciden. De las relaciones 


FAQPG)=ME—F-"G, 
EPOF,—G)=M-=F76, 
se desprende que también coinciden los factores invariantes de las 
matsices AE—F-1G y AE—Fi'G,. Puesto que éstas son las matri- 
ces características de F-G y F7'G,, de aquí se deduce (p. 15.3) 
que F=1G y Fī!G, son semejantes, es decir, que existe una matriz 
regular T que satisface la relación 


F26,=T=F=GT. 


Tenemos ahora 
MEF PO, = TA AEF=G)T =TA FA (AF—G)T, 
AF, — G, =F,T IFA AP6)T, 


D En el caso general, además de los factores invariantes, es preciso consi- 
derar también los así llamados indices minimales. 
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de donde 
¡=UFV' y G,=UGV", 


donde U =F,T='F-* y V=7". Por consiguiente, los pares F, G y 
F,, G, son equivalentes. 


23.2. Congruencia de pares de formas. Una sucesión de formas 
bilineales en las variables E ..., En y h N, de matrices 
i» «+», Ap se llama congruente de una sucesi formas bilinea- 
les de matrices B,, ..., Bẹ si mediante una misma transformación 
de ambos sistemas de variables las formas de la primera sucesión 
pueden ser reducidas a las formas correspondientes de la segunda 
sucesión. 
Indicando por T la matriz de la transiormación de las variab- 


les, tendremos 
Bj=TAJT" (i=1,2,..., k). (2) 


Dos sucesiones Ay, ..., Ag y Bis -+s Ba de matrices arbitrarias 
se llaman congruentes si existe una matriz regular T que cumple 
las condiciones (2). 

Análogamente se dice que una sucesión de formas cuadráticas 
o de formas cuadráticas hermitianas es congruente de otra sucesión 
de formas, si mediante una transformación adecuada invertible de 
las variables las formas de la primera sucesión pueden ser reduci- 
das simultáneamente a las formas correspondientes de la segunda 
sucesión, 

Es obvio que la condición (2) es necesaria y suficiente para la 
congruencia de las formas cuadráticas de matrices A,, ..., As y 

Bs. Para las formas hermitianas esta condición debe Cer 
sustituida por la siguiente 
Bj=TAJT' (1, 2, ..., A). 


El problema general que hemos planteado acerca de la congruen- 
cia de sucesiones de formas bilineales es muy complejo ya para un 
par de formas. En la segunda mitad del siglo pasado Weierstrass 
obtuvo las condiciones necesarias y suficientes de congruencia en el 
caso en que ambas formas del par son simétricas y, en particular, 
si las formas son cuadráticas y una forma del par es regular. 
Estas condiciones serán expuestas al concluir este punto. El caso 
general de congruencia de pares de formas cuadráticas fue exami- 
nado por Kronecker. Debido a que las condiciones de Kronecker 
son un tanto voluminosas, suelen exponerse en tratados más espe- 
ciales. Tanto las primeras condiciones como las segundas se refieren 
a formas sobre el cuerpo de los números complejos. El caso de 
cuerpos conmutativos de otros tipos fue analizado por Dixon y 
otros autores. 

Consideraremos primero el caso más importante de un par de 
formas cuadráticas reales cuando una de ellas es definida positiva. 


18—1843 
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TEOREMA 2. Todo par de formas cuadráticas reales en n variables 
tal que una de ellas es definida positiva puede ser reducido, mediante 
una adecuada transformación real de las variables, al par de formas 


de tipo 
BHE... Ey aabt. tata (3) 


Los números ay, ..., tt, Se determinan univocamente, salvo el orden 
en que siguen, por las formas iniciales y no dependen del método de 
reducción. 

En efecto, sean F (E E 963 Jas formas cuadráticas dadas. Puesto 
que la primera es definida positiva, es posible reducirla, mediante 
una adecuada transformación lineal de las variables, a la suma de 
los cuadrados de las variables. Así obtenemos el par de formas de 


tipo 
B+E... +8 y Daily 


Ahora buscamos una transformación de las variables de matriz 
ortogonal real U que reduzca a la forma diagonal la segunda forma. 
Como en este caso la matriz de la primera forma en las variables 
nuevas será igual a 


UEU'=UU'=E, 


es decir, la primera forma conserva su forma unitaria, resulta que 
después de la transformación señalada las formas dadas serán del 
tipo requerido (3). 

Supongamos, finalmente, que mediante una transformación de 
las variables las formas F y G se reducen al tipo (3) y mediante 
otra transformación se reducen a 


EHEH... A ER y PEE Pata. (4) 


Existe entonces una transformación de las variables de matriz T 
que reduce el par (3) en el par de formas (4) y, por consiguiente, 
las matrices de estas formas estarán ligadas por las relaciones 


E=TET' y B=TAT', (5) 


donde A es la matriz diagonal de elementos œ ..., % y B es 
la matriz diagonal de elementos $, Pa a lo largo de la dia- 
gonal principal, De la primera de las jones (5) resulta TT’ = £, 
de donde B=TAT”-*, es decir, las matrices A y B son semejantes 
y los números característicos œ, ..., a, de la primera deben 
coincidir con los números característicos f,, ..., Ba de la segunda. 

Para las formas cuadráticas hermitianas tiene lugar un teorema 
totalmente análogo. 

TEOREMA 2s. Todo par de formas cuadráticas hermitianas tal que 
la primera es definida positiva se puede reducir, mediante una ade- 
cuada transformación lineal compleja de las variables, en el par de 
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formas de tipo 
E abitat -+ em 
donde los números %,, ..., %, se determinan univocamente por las 


formas iniciales y no dependen del método de reducción. 

La demostración es análoga a la anterior. 

Pasando a considerar el caso general observemos, ante todo, 
que la congruencia de un par de matrices implica indudablemente 
la equivalencia de las mismas. Inesperadamente resulta que bajo 
ciertas condiciones es válida también la afirmación recíproca, 

TEOREMA 3. Supongamos que en dos pares de matrices cuadradas 
F, G y F, G, las primeras matrices F y F, son ambas o bien si- 
métricas o bien antisimétricas y que las segundas matrices G y G, 
son ambas también o bien simétricas o bien antisimétricas, Entonces, 
sobre el cuerpo de los números complejos, de la equivalencia de los 
pares señalados se deduce la congruencia de los mismos. 

Existen, por hipótesis, unas matrices regulares U y V tales que 

F,=UFV y G,=UGV”, (6) 

Pasando a las matrices tramspuestas, obtenemos de aquí que 

Fi=VF'U' y G¡=VG'U”, Puesto que las matrices F y F, son si- 
métricas o antisimétricas de aquí resulta 

PF,=VFU'; 1) 


una igualdad análoga tenemos para G,. Comparando (7) y (6) 
encontramos 


UFV: =VFU' y VU -F=F-(Y=Uy. (8) 
Tomemos V-"U =T. La segunda de las igualdades (8) da 
TF =FT", 
TiF=FT», 
de donde 
(QEFQT +. pa TF=F(aME+aT +... 4047"), 


donde os, “, -.., a, son unos números arbitrarios. En el capítulo 
IV (p. 16.3) hemos demostrado que los números %, ..., % se 
pueden escoger de manera que el polinomio 


0(T)=0WE+aT+...+047T* 


sea raiz cuadrada de T, es decir, que p(T)9(T)=T. Tomemos 
P=VQ(T), entonces 


PER! =VG (T) Fo (T') V’ =V (T) (T) EV! =VTFV' = UFV", 
18* 
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es decir, 

PFP =F, 
Repitiendo estos mismos razonamientos para la matriz G, encon- 
tramos 

PGP'=6,. 


Por consiguiente, los pares F, G y F,, G, son congruentes que es 
lo que se quería demostrar. 

Los teoremas 1 y 3 permiten enunciar la siguiente condición de 
congruencia de un par de matrices: 

Sean dados dos pares de matrices F, G y F,, G, Si F y F, 
son regulares y son ambas o bien simétricas o bien antisimétricas y 
si G y G, también son ambas o bien simétricas o bien antisimétricas, 
la condición necesaria y suficiente de congruencia de los pares F, G 
y F,, G, sobre el cuerpo de los números complejos es la coincidencia 
de los factores invariantes de las matrices AF—G y AF, —6,. 

Efectivamente, si los factores invariantes de las malrices AF —G 
y AF,—G, coinciden, los pares F, G y F,, G, son equivalentes en 
virtud del teorema 1. Pero estos pares serán entonces, debido al 
teorema 3, también congruentes. Reciprocamente, si F, G y F, 
G, son congruentes, son desde luego equivalentes y, por consiguien- 
te, los factores invariantes de la matriz AF—G coinciden con los 
factores invariantes de la matriz AF,—G,. 

Las aplicaciones del teorema 3 a la determinación directa de 
las formas elementales de pares de formas complejas serán conside- 
radas más tarde, en el cap. VII. Aplicando este teorema obten- 
dremos en el punto siguiente la solución del problema de congruen- 
cia de las formas bilineales no simétricas. 

Observemos también que si hasta el teorema 3 las formas cua- 
dráticas reales y las formas hermitianas se comportaban igualmente, 
el teorema 3 deja ya de ser válido para las formas hermitianas. 
El ejemplo correspondiente será expuesto al principio del $ 28. 


23.3. Congruencia de formas bilineales no simétricas. Como ya 
hemos señalado anteriormente, los resultados del punto precedente 
permiten enunciar las condiciones necesarias y suficientes para la 
congruencia de cualesquiera formas bilineales complejas regulares 
complementando con ello esencialmente los resultados del p. 21.3. 

TEOREMA 4. Para que unas formas bilineales complejas regulares 
de matrices G y G, sean congruentes es necesario” y suficiente que 
iaa los divisores elementales de las -matrices AG—G' y 

.—Gi. 

DEMOSTRACIÓN. Supongamos que las formas son congruentes. Las 
matrices G y G, están ligadas entonces por las relaciones 


G,=UGU". 
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De aqui 
G=UGU". 

Por consiguiente, el par de matrices G, G' es congruente del par 

de matrices G,, Gi y los divisores elementales de la matriz 1G—G" 

coinciden con los divisores elementales de la matriz àG, — G,. 
Supongamos, recíprocamente, que los divisores elementales de 

las matrices AG—G' y 1G,—G; coinciden. Entances el par G, G’ 

es equivalente al par G,, G;, en virtud del teorema 1, por lo tanto 


G,=UGV' y G¡=UGV”. (9) 
Tomemos 
04+0'=S, G—G'=T, G,+6;=S, y G,—G;=T,. 
De (9) resulta que 
S,=USV' y T,=UTV' 
es decir, el par S, 7 es equivalente al par S,, 7,. Puesto que las 
matrices S y S, son simétricas y las matrices T y ñ son antisi. 


métricas, los pares S, T y S,, T, son, en virtud” del teorema 3, 
congruentes, es decir, 


S,=PSP' y T,=PTP", (10) 
Pero G= FL y G= S47 y, por esto, de (10) se desprende que 
G,=P0P”. 


Por consiguiente, las matrices G y G, son congruentes. 

El teorema 4 muestra que las formas bilineales regulares sobre 
el cuerpo de los números complejos se determinan, salvo un iso- 
morfismo, por los divisores elementales de la matriz AG —G'. Lue- 
go, para resolver el problema de la clasificación de estas formas es 
suficiente indicar los sistemas de expresiones de tipo (A—a)” que 
preh servir como divisores elementales de las matrices de tipo 

G—G'. Es fácil ver que estos sistemas no pueden ser arbitrarios. 
En efecto, supongamos que (A—«a)” figura £ veces en el sistema 
de divisores elementales de una matriz 4G—G'. Entonces (A—a)” 
figurará también k veces en el sistema de divisores elementales de 
la matriz transpuesta AG'—G. Pero la matriz AG'—G es equiva- 
lente a la matriz G'-1(4G'—G)=1E—G" por consiguiente, 
Aa" figura k veces en el sistema de divisores elementales de 
la matriz ¿£—G'”'G. El teorema sobre los divisores elementales de 
una función (p. 16.4) afirma que todo divisor elemental (A—a)” 
de la matriz AE—G'-1G se transforma en el divisor elemental 
(M—a”2)" de la matriz AE —(G'-1G)"2. Puesto que la última ma- 
triz es equivalente a 1G—G”, la expresión (A —a”2)” figura k veces 
en el sistema de divisores elementales de la matriz 1G—G'. Por 
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consiguiente, si (A—a)” es un divisor elemental de mutiplicidad k 
de la matriz AG—G', resulta que (L—a”)" también será un di 
sor elemental de mulliplicidad k de la misma. Siendo a= +1, esta 
condición es trivial. Con razonamientos adicionales se puede de- 
mostrar que las matrices AG—G” contienen todo divisor de tipo 
(A+ 1)%+1 necesariamente un número par de veces, mientras que 
los divisores elementales de tipo (A—1)29+* y (A + 1)% puden fi- 
gurar en estas matrices en combinaciones arbitrarias. Las condi- 
ciones expuestas, para œ, tanto iguales como diferentes de z1, 
además de ser necesarias, son lambién suficientes para que un 
sistema de expresiones de tipo (A—a)" sea el sistema de divisores 
elementales de una matriz AG—G'. 


Ejemplos y problemas 
1. Redúzcanse a la forma elemental, mediante una transformación real de 
las variables, los pares de formas 
a) PERA y des 
b) 2114 2xy+2x2 4224 2y24-22% y —9+361y+18x24 15y24 18y2-+ 182%, 
2. Todo par compuesto por formas bílineales reales, una de las cuales es 


simétrica definida positiva y la otra es antisimétrica, puede ser reducido, me- 
diante una transformación real de las variables, a Ja forma 


BO Ea Ebo Y a (a — EMO H -Har (Bay Mar — Ear Mara) 
3. Demuéstrese que el par de formas de matrices 
—2 6 o 6 
[ 1 $] y [ ti 
es equivalente al par de formas de matrices 
2—3 —10 $ 
2 31 21]: 


Para la demostración generalicese el teorema 1 del p. 23.1 al caso de pares 
A, B tales que |24-+H48] #0, considerando para ello los factores invariantes 
que son polinomios homogéneos en A y p. 

4. Demuéstrense las últimas afirmaciones del Pp. 23.3, 


$ 24. Funciones bilineales 


La teoría de formas bilineales puede ser interpretada geométri- 
camente como la teoría de funciones bilineales en espacios lineales. 
Esta interpretación permite al mismo tiempo comprender con más 
profundidad los resultados principales de la teoría de formas; el 
parágralo presente está dedicado a la exposición de la misma. 


24.1. Definiciones principales, Se dice que sobre un espacio 


lineal Y se ha definido una función p(x, y) de dos vectores va- 
riables x e y, si a todo par de vectores del espacio £ se pone en 
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correspondencia un determinado elemento p(x, y) del campo prin- 
cipal K del espacio considerado. La función q(x, y) se llama bili- 
neal si es lineal respecto a cada una de las variables por separado, 
es decir, si satisface las identidades 


Pla Hs Y =P (X Y HAD (Y), (1) 
olx, Bu HB) = Bp Y) EBAY). (2) 


Una función bilineal sobre un espacio complejo lineal se llama 
bilineal hermitiana, si es lineal respecto a la primera variable y 
antilineal respecto a la segunda, es decir, si satisface la relación 
(1) y la relación 


e Bn +B) =P, 0 Y) FB Ya). (3) 


De (1), (2) y (3) se deduce directamente la regla general distri- 
butiva 


PA AA =D Y) (4) 
que es válida tanto para las formas bilineales como para las bili- 


neales hermitianas. 
Tomemos en £ una base arbitraria a, ..., 4, y sea 


A=EJ01 Hiag H > + Eno 
Y =N/4 HN +++ F Naan 


De las fórmulas (2) y (4) resulta 


o, y=Xo(a, aim =D 0h 8, (y=, a). (5) 


La matriz A= gul se llama matriz de la función p(x, y) en la 
base señalada. Es obvio que conociendo la matriz A conocemos 
también la función p(x, y), ya que la fórmula (5) permite calcular 
los valores de p(x, y) cualquiera que sea el par de vectores x, y. 

La correspondencia entre las matrices y las formas bilineales es 
biyectiva, ya que cualquiera que sea la matriz A la función p(x, y) 
calculada por la fórmula (5) será bilineal de matriz A. 

Indicando por [x] e [y] las filas coordenadas de los vectores x 
e y, podemos representar la fórmula (5) en la forma matricial 


e Y=[x A [g] (6) 


que permite deducir directamente la siguiente regla de transforma- 
ción de las matrices de funciones bilineales: sí en una base la matriz 
de una función bilineal es A, la matriz de la función en una base 
nueva será 

A,=TAT", m 


donde T es la matriz del cambio de la base antigua por la nueva. 
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Efectivamente, aplicando la fórmula (6) en las bases antigua y 
nueva, tenemos 


o% 9y=[x14 [y = [xh TAT [y] = [x], 4, [ylis 


donde A,, [x], e [y], son, respectivamente, la matriz de la función 
g(x, Y) y las filas Coordenadas de los vectores x e y en la base 
nueva. Por esto, A,=T AT”. 

Considerando en la fórmula (5) las coordenadas de los vectores 
x e y como variables independientes, vemos que el valor de una 
función bilineal en toda base se expresa mediante una forma bilineal 
cuya matriz coincide con la matriz de la función en esta base. 

Según (7), el paso a una base nueva implica la sustitución de 
la forma bilíneal por la correspondiente forma congruente, debido 
a lo cual las formas bilineales congruentes pueden ser consideradas 
como formas bilineales de una misma función bilineal, pero calculadas 
en diferentes bases. 

Una función bilineal p(x, y) se llama simétrica si 


(x, y=p (Y x) > 


e, y=—9(% y). 
Es evidente que las funciones bilineales simétricas y antisimétricas 
son aquellas Funciones cuyas formas bilineales son, respectivamente, 
simétricas y antisimétricas. 
Si ọ(x, y) es una función bilineal arbitraria, las funciones 


at y=qlo(a Y+0W, 0] y 
ae, =p ley ou] 8) 


serán bilineales y, respectivamente, simétrica y antisimétrica. Como 
de (8) se deduce que 

P(x, y) =P Y) +P (x, y) 
resulta que toda función bilineal puede ser representada como la 
suma de funciones simétrica y antisimétrica, con la particularidad 
de que, como es fácil de ver, está representación es unívoca. 

Las funciones de tipo p(x)=g(x, x), donde q(x, y) es una 
función bilineal, se llaman cuadráficas. Por consiguiente, las fun- 
ciones cuadráticas son aquellas funciones de un vector variable que 
aparecen al identificar los vectores variables en las funciones bili- 
neales, Pero si una función cuadrática w(x) aparece de la forma 
explicada de una función bilineal p(x, y), la función (x) aparece 
también al identificar las variables en la función bilineal simétrica 
P(x, y): 


y antisimétrica si 


e =g lo, DAR d= x) 
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Por esto al considerar las funciones cuadráticas se puede aceptar 
que son generadas por funciones simétricas solamente. 
Por otra parte, si p(x, y) es simétrica y p(x)=0 (x, x), se tiene 


VOFY=P(+Y, x+y)= g(x, +29 (x, Y) +0 (9, y) 


oe =g (P+D (00), 


es decir, toda función cuadrática aparece de una función simétrico 
bilineal y sólo una, que se llama polar de la función cuadrática co- 
rrespondiente, 


Sea aj, .... a, una base del espacio y sea p(x)=q(x, x), donde 
9 (x, y) es una función bilineal simétrica. Entonces para x=E,4,+... 
++ «Ey, tenemos 

Y) =p(x =De (a, a) EE, 

es decir, el valor de una función cuadrática se expresa mediante una 
forma cuadrática en las coordenadas de un vector variable, cuya matriz 
coincide con la matriz de la correspondiente forma bilineal polar. 

Razonando análogamente, obtenemos para los valores de una 
función bilineal hermitiana «(x, y) en lugar de la fórmula (5) la 
fórmula 

o = Do (a, a)5m), 


es decir, una forma bilineal hermitiana. Al pasar a una base nueva 
la matriz de una función hermitiana varía según la ley 
A =TAT. 
Una función hermitiana p(x, y) se llama simétrica si 
Dx, y= ply, x). 


Los valores de las funciones hermitianas simétricas se expresan 
mediante formas bilineales hermitianas simétricas. 

Las funciones de un vector variable que surgen al identificar 
los vectores variables en las funciones bilineales hermitianas simé- 
tricas se llaman funciones cuadráticas hermitianas. La relación entre 
las funciones cuadráticas hermitianas y las coorrespondientes fun- 
ciones bilineales simétricas hermitianas viene dada por las fórmulas 


VAU+HIY)=P(+ iy, + ly) = 
=0(% x) +ilp æ, Y—9( Y +ou, y) 
POT DAPO Hol, Hoy, Y. (9) 
2 (x, y) =Y (x+y) + ip (x+ iy) — 

—(1+0[v0+4). 
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Calculando el valor de una función wp(x) cuadrática hermitiana 
para el vector x==5,0,-+...-+E,d,, donde a, ..., a, es una base 
del espacio, obtenemos 


v= Xola, api E 


es decir, el valor de una función cuadrática hermitiana se expresa 
mediante una forma cuadrática hermitiana en las coordenadas del 
vector variable, cuya matriz coincide con la matriz de la correspon- 
diente función bilineal simétrica hermitiana calculada mediante la 
fórmula (9). 

Indiquemos también que las formas cuadráticas de signo constante, 
consideradas en el p. 22.4, corresponden a aquellas funciones cua. 
dráticas en el caso de un espacio real y a aquellas funciones cua- 
dráticas hermitianas en el caso de un espacio complejo cuyos valores 
no cambian de signo. 


24.2, Espacios de métrica bilineal. Como hemos señalado en el 
p. 17.1, un espacio lineal complejo o real se llama unitario si en 
él está definida una función de dos vectores variables, llamándose 
producto escalar de estos vectores los valores de la misma, Los 
axiomas que hemos indicado en esa ocasión signitican simplemente 
que el producto escalar es una función bilineal hermitiana definida 
positiva. Por esto, el estudio de las propiedades de los espacios 
unitarios no es otra cosa que el estudio, desde un punto de vista 
especial, de las propiedades de las funciones bilineales definidas 
positivas. 

Por analogía con esto diremos que un espacio lineal £ es bili- 
neal métrico, si en él está definida una función bilineal, cuyos 
valores se llamarán productos escalares de los vectores y se indi- 
carán por (a, b). En el caso en el que el producto escalar sea una 
función bilineal hermitiana simétrica diremos que el espacio está 
provisto de una métrica bilineal hermitiana. 

Si la matriz del producto escalar es regular, el espacio se llama 
no degenerado. En el caso contrario se dice que el espacio es 


degenerado, 
La matriz 
(a, a) ... (0, Gp) 
G=|(%, 2) - 

(am 01) ~- (Am, an). 
formada por los productos escalares de los vectores a, ..., a, de 
un espacio bilineal métrico £, se Hama matriz de Gram del sistema 
a, «>=, Aa. La matriz de Gram correspondiente a unos vectores 
Ay, ..., a, que constituyen una base del espacio £, se llama sim- 


plemente matriz de la función bilineal principal p(x, y)=(% y) 
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calculada en esta base. De aqui se deduce que las matrices de 
Gram correspondientes a diferentes bases del espacio son congruen- 
tes y, por consiguiente, son del mismo rango. 

Ea la deris de los espacios unitarios desempeña un papel 
importante el concepto de ortogonalidad de vectores. Este concepto 
se extiende directamente al caso de espacios bilineales métricos. 

Sea £ un espacio bilineal métrico corriente o hermitiano. Se 
dice que un vector a de £ es ortogonal a un vector b, si (a, b)=0. 
Si a es ortogonal a b, ello no significa todavía que b sea ortogonal 
a a, ya que en el caso general (a, b) (b, a). Por esto a veces se 
dice, para una mayor claridad que a es ortogonal a b a la izquierda 
y que b es ortogonal a la derecha a a. De las leyes distributivas (1) 
y (2) se deduce que siendo a ortogonal a varios vectores Ay, ..., am. 
el vector a será ortogonal a cualquier combinación lineal de los 
mismos, De aquí resulta, a su vez, que el conjunto de los vectores 
de un pacio A ortogonales todos ellos a la derecha a los vectores de 
un sistema W constituye un subespacio lineal del espacio £. Indica- 
remos este subespacio por Mt. El conjunto de los vectores de L 
ortogonales a la pierda a M también es un subespacio lineal 
que indicaremos 14M. 

Diremos que un vector x es isótropo a la izquierda en el espa- 
cio Y, si es ortogonal a la izquierda a todos los vectores de £, El 
subespacio 1£, formado por todos los vectores isótropos a la iz- 
quierda de £, se llama subespacio isótropo a la izquierda de £. Análo- 
gamente se definen los vectores isótropos a la derecha y el subespacio 
isótropo a la derecha QL. 

TEOREMA 1. Las dimensiones de los subespacios isótropos a la 
izquierda y a la derecha son iguales y coinciden con el defecto de la 
matriz de la forma métrica (x, y) calculada en una base cualquiera. 
Por consiguiente, la diferencia entre la dimensión del espacio y la 
dimensión de los subespacios isótropos el igual al rango de la forma 
bilineal métrica; un espacio bilineal métrico es no degenerado cuando, 
y sólo cuando, no contiene vectores isótropos no nulos. 

Tomemos para la demostración una base de £. Entonces los 
vectores x isótropos a la izquierda deben verificar para cualquier y 
de £ la relación 

(o y=[x A [y =0, (10) 


donde A es la matriz de Gram de la base tomada. Pero de (10) se 
deduce que 
[x] 4=0 


(aquí O es la fila nula), es decir los vectores isótropos a la iz- 
quierda forman el núcleo de la aplicación lineal de matriz A (p. 10.1) 
y la dimensión del núcleo de una aplicación lineal es igual al 
defecto de la matriz de la aplicación. Análogamente comprobamos 
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que la dimensión del subespacio isótropo a la derecha es igual a la 
dimensión del núcleo de la aplicación lineal de matriz transpuesta 
A" y, por consiguiente, coincide con el defecto de la matriz A que 
es lo que se quería demostrar. 

Todo subespacio lineal A de £ puede ser considerado por sí sólo 
como un espacio bilineal métrico hermitiano o corriente, respecti- 
vamente, respecto al mismo producto escalar que opera en $. En 
el caso general, si & es no degenerado, ello no implica todavía que 
sus subespacios sean no degenerados y recíprocamente, si un subes- 
pacio Y es no degenerado, esto no implica que todo el espacio € 
sea no degenerado. 

TEOREMA 2. Si A es un subespacio no degenerado del espacio £, 
para 2 tienen lugar las descomposiciones directas 

LSA AAH an 
Reciprocamente, si al menos una de las descomposiciones (11) es válida, 
el subespacio A es no degenerado. 

Efectivamente, la intersección ANAL es el subespacio isótropo 
a la derecha de Y. Como A es no degenerado, tenemos AN Al=0 
y, por consiguiente, la suma A+4-AL es directa. 

a ahora c un vector cualquiera de £. Tomemos 


(ap )=v, (i=l,...,. m), 
donde a, ..., 4, es una base de A. El sistema auxiliar de ecua- 
ciones 
(ap a)i + (aj a) E +... + (aj, Gm) En = Y, 
(=l, .... m) 
puede ser resuelto respecto a E,, ..., Èm, ya que su determinánte 
es el determinante de la matriz de Gram del sistema a,, ..., am 


es diferente de cero debido a que Y es no degenerado. El vecio: 
aspa -H o -FEnda pertenece a A y, además, 
(a, c—a)=0 (i=1, ..., m), 

es decir, c—a€ AL. Puesto que para todo c es válida la descom- 
posición 

c=a+(c—a) (aù y c—aE4A2), 
resulta que es la suma de A y AL que es lo que se quería 
demostrar. 

Unos espacios bilineales métricos sobre un mismo cuerpo con- 
mutativo de coeficientes se llaman isomorfos, cuando entre sus ele- 
mentos se puede establecer una correspondencia biyectiva que trans- 
forma una suma de vectores en la suma correspondiente, el producto 
de un número por un vector en el producto del mismo número por 
el vector correspondiente y el producto escalar de un par de vecto- 
res en el producto escalar del par de vectores correspondientes. 
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De la última condición se ve, en particular, que en una corres- 
pondencia isomorfa las matrices de Gram de los sistemas correspon- 
dientes de vectores coinciden. Viceversa, si en dos espacios bilinea- 
les métricos sobre un mismo cuerpo conmutativo existen bases con 
las mismas matrices, los espacios son isomorfos. 

Para los espacios lineales corrientes y unitarios hemos demostrado 
antes que existe un espacio único, salvo un isomorfismo, de dimen- 
sión n. Para los espacios bilineales métricos la situación es más 
compleja. 

emostremos, ante todo, la siguiente afirmación casi evidente: 

TEOREMA 3. Unos espacios bilineales métricos sobre un mismo cuerpc 
conmutativo son isomorfos cuando, y sólo cuando, las matrices de Gram 
unas bases arbitrarias, escogidas en estos espacios, son congruentes. 

La necesidad es clara, ya que las matrices de Gram de todas 
las bases de un espacio dado son congruentes y las matrices de Gram 
de las bases correspondientes de espacios isomoríos coinciden. Por 
otro lado, si A y B son las matrices de Gram de unas bases de 
unos espacios Y y £, y A y B son congruentes, en £ existe tam- 
bién una base de matriz B, de acuerdo con los resultados del punto 
anterior. 

El teorema 3 significa que el problema de la clasificación de 
espacios bilineales métricos no isomorfos es idéntico al problema de 
la clasificación, salvo una congruencia, de las formas bilineales; 
este problema ha sido ya examinado en el p. 23.3. Nos limitaremos 
aquí a enunciar, en términos de la teoría de espacios bilineales 
métricos, algunos corolarios de los resultados del punto mencionado. 

Los espacios bilineales métricos reales no degenerados de métrica 
simétrica (x, y)=(y, x) se llaman seudoeuclídeos. 

La matriz de Gram A de una base arbitraria de un espacio 
seudoeuclídeo es simétrica real. Según el teorema 1 del p. 21.3, Ja 
matriz A es congruente a una matriz diagonal con los números 
+1 o —! en la diagonal principal. En otras palabras, en todo 
espacio seudoeuclídeo de dimensión n existe una base en la que el 
producto escalar de los vectores de coordenadas E,, -.., En Y Mys -> +, Ma 
se expresa mediante la forma 


(e Y) EM EM — Es Na 0 ++ — Eno 


El número 0=s—(n—s) se llama signatura del espacio. 

Por consiguiente, los espacios seudoeuclideos se determinan, salvo 
un isomorfismo, por su dimensión y su signatura. Además, para 
cualquier n > 0 y cualquier s (O< s <n) existe un espacio seudoeu- 
clídeo de dimensión n y de signatura s—(n—s). 

Los espacios bilineales métricos no degenerados de métrica anti- 
simétrica (x, y) =— (y, x) se llaman simpliciales. 

La matriz de Gram de una base de un espacio simplicial es 
anlisimétrica y por esto, debido al p. 15.5, es congruente a una 
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matriz celular diagonal con células de tipo [_9 į] a 10 largo de 


la diagonal principal. Por consiguiente, la dimensión de un espacio 
simplicial es siempre un número par y para todo n existe, salvo un 
isomorfismo, un espacio simplicial único de dimensión 2n. En todo 
espacio simplicial de dimensión 2n existe una base en la que el pro- 
ducto escalar es de la forma 


(e y) = Èa — EM + - - - Esa Man — Ea Men—10 
Ean Y Ms ===» Man SOn las coordenadas de los vecto- 


donde E 
res x ey 

Un espacio bilineal métrico complejo no degenerado de métrica 
simétrica se llama euclideo complejo. Puesto que toda forma bilineal 
simétrica regular se puede reducir sobre el cuerpo de los números 
complejos a la forma de matriz unidad, para toda dimensión n 
existe, salvo un isomorfismo, un espazio euclídeo complejo único 
En todo espacio euclideo de dimensión ^ existe una base en la que el 
producto escalar es de la forma 


E, =E HEM -o o H Ena 
Finalmente, los espacios complejos no degenerados de métrica 
simétrica hermitiana (x, y)={y, x) se llaman seudounitarios. Del 
teorema 2 del p. 21.3 se deduce que en todo espacio seudounitario 
de dimensión n existe una base en la que el producto escalar es de la 


forma E _ A 
W DEEM e AE — E Meri + > + — Ena 

El número 0=s—(n—s) se llama signatura del espacio seudou- 
nitario. Con la dimensión n determina, obviamente, el espacio 
seudounitario, salvo un isomorfismo. 

En cuanto a la clasificación de espacios bilineales métricos com- 
plejos no degenerados cualesquiera, ésta se obtiene en base al teo- 
rema 4 del p. 23,3. Para caracterizar el espacio es necesario en 
este caso escribir el conjunto de divisores elementales sujeto a las 
condiciones indicadas al final del p. 23.3, 

24.3, Funciones bilineales en espacios bilineales métricos. En el 
punto anterior hemos logrado geometrizar la teoría de una función 
bilineal, definida sobre un espacio lineal €, gracias a que hemos 
considerado los valores de la función bilineal como los productos 
escalares de los vectores, definiendo asi una métrica especial en Q. 
Análogamente, para geometrizar la teoría de pares de funciones bili- 
neales, definidas sobre un espacio lineal £, una de ellas se toma 
como la función métrica y la otra se considera como una función 
bilineal definida sobre un espacio bilineal métrico. Está claro que 
el par p(x, y), p(x, y) y el pe Q(x, y), P(x, y) serán ahora seme- 


jantes respecto a los automorfismos de un espacio lineal & cuando, 
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y sólo cuando, la función q, (x, y) puede ser reducida a la función 
Q. (x, y) mediante un automorfismo del espacio bilineal métrico & de 
función métrica principal p(x, y). 

Es más, en los espacios bilineales métricos no dege nerados es 
posible relacionar biyectivamente con toda función bilineal una 
aplicación lineal del espacio. Puesto que esta relación no depende 
de cómo se escoja la base, resulta así que el estudio de las funcio- 
nes bilineales equivale al estudio de las aplicaciones lineales de 
espacios bilineales métricos. Desde el punto de vista de la teoría 
de espacios lineales, esto significa que el estudio de pares de fun- 
ciones bilineales, de las cuales una es no degenerada, equivale al 
estudio de pares formados por una función bilineal no degenerada y 
por una aplicación lineal. 

Sea, pues, un espacio bilineal métrico no degenerado hermi- 
tiano o corriente. 

TEOREMA 4. Toda función lineal f(x) definida sobre & puede ser 
representada univocamente en la forma (x, a). 

Efectivamente, la condición f(x)=(x, a) equivale al sistema de 
relaciones 


(a, aj=f(a) U=l...,m, (12) 


donde a, , 4, es una base de £. Tomando a=f,0,+...-+E/4 

considerando (12) como un sistema de ecuaciones respecto a 
eN ..., Ën, vemos que éste es un sistema de n ecuaciones lineales 
con n incógnitas de determinante diferente de cero, ya que el último 
es el determinante de la matriz de la forma principal en la base 
escogida. Por consiguiente, las ecuaciones (12) tienen una solución 
única. 

Igual que esto ha sido hecho en el p. 18.2 para los espacios 
unitarios, el teorema 4 puede ser empleado para introducir en £ el 
concepto de la aplicación conjugada. 

Consideremos una aplicación lineal cualquiera 4 de este espacio, 
La expresión (x4, a) representa para todo vector dado a una fun- 
ción lineal de x. Según el teorema 4, en el espacio existe un 
vector determinado b tal que 


(x4, a) = (x, b) a3) 
ara todo x. Indiquemos por .4* la aplicación que transforma a en b. 


ntonces b=ax* y la igualdad (13) puede ser representada en la 
forma 


(x4, a) = (x, ad”). (14) 


La aplicación 4* se llama conjugada a la derecha de £. La propie- 
dad (14) caracteriza plenamente la aplicación conjugada a la derecha, 
Efectivamente, si para una aplicación 2 tenemos (xw, a) =(x, aB) 
cualesquiera que sean a y x, comparando esta igualdad con (14) 
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encontramos la relación (x, aA*—aB)=0 de la cual resulta que 
ad" —aB es un vector isótropo del espacio l. Puesto que £ no 
contiene vectores isótropos no nulos, tenemos a4*—aB=0 y 4*= 3, 


Repitiendo los razonamientos del A 18.2 es fácil demostrar 
que .4* es lineal y que son válidas las fórmulas corrientes 

(448) (15) 

(ABBA, (16) 

(at) =at (17) 


5) los espacios bilineales métricos corrientes y las fórmulas (15), 
) y 


(LA =a4" (18) 


para los espacios bilineales métricos hermitianos. 

Resolvamos ahora el problema sobre la relación que existe entre 
las matrices de la aplicación 4 y de su conjugada a la derecha .4*. 
Tomemos para ello una base en % e indiquemos las matrices de las 
aplicaciones 4 y 4* por A y B, respectivamente. Sea £ un espacio 
corriente. Basándonos en las fórmulas (6) del p. 24.1, obtenemos 


(xt. a)= [x4] G [a]' = [x] AG [a]”, 
(x, a4*)= [x] G [a4*]'=(x] GB' [a]', 
donde G es la matriz de Gram del espacio 2 en la base escogida. 
De aquí 
AG=GB' y B'=G- AG. (19) 


En el caso de espacios bilineales métricos hermitianos las fórmu- 
las (19) se sustituyen por las relaciones 


AG=GB" y B'=G~> AG. (20) 


Hemos visto que en los espacios unitarios existen sistemas orto- 
normales de coordenadas. En estos sistemas la matriz de Gram se 
convierte en la matriz unidad y las relaciones (20) nos ofrecen el 
resultado conocido a 18.2): B' = A. 

Hemos definido hasta el momento sólo la aplicación conjugada 
a la derecha. Es obvio que de la misma forma se puede introducir 
también la aplicación conjugada a la izquierda. Es decir, sea 4 
una aplicación lineal de . Repitiendo los razonamientos realizados 
anteriormente, veremos que en 2 existe una aplicación única 8 que 
cumple la igualdad 

(x, ad) =(x8, a) 
cualesquiera que sean x y a. 


La aplicación $ es lineal. Convedremos en llamarla conjugada 
a la izquierda de 4 y en indicarla por *4. 
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Si la métrica de % es simétrica o antisimétrica, las aplicaciones 
conjugadas a la derecha y a la izquierda de cualquier aplicación lineal 
coinciden, ya que 

QA, Y) = E (y, A) = E (yA, x)= (x, yA) = (A, y). 


Pasando a la consideración de las funciones bilineales sobre £, 
observemos ante todo que el valor de la expresión (xt, y), donde s 
es una aplicación lineal, representa una función bilineal y, respecti- 
vamente, una función bilineaf hermitiana en £. 

Si las aplicaciones lineales A y B son diferentes, las funciones 
bilineales correspondientes (x4, y) y (xB, y) también son diferentes. 

En efecto, lo contrario significaría que (x4, y)=(xĐ, y) para 
todos los x e y de £. De aquí resultaría (4 —x2B, y)=0 para 
todos los valores de y, es decir, x£—x® sería un vector Isótropo 
a la izquierda. Puesto que £ no contiene vectores isótropos no nulos, 
tendriamos x4 =x, es decir, 4 =. 

Probemos ahora que toda función bilineal f (x, y) definida sobre & 
puede ser representada en la forma (xA, y), donde A es una aplica- 
ción lineal del espacio €. En esta proposición debe comprenderse 
por f(x, y) una función corriente, si £ es un espacio bilineal mé- 
trico corriente, y una función hermitiana, si £ es un espacio bilineal 
métrico hermitiano. 

Efectivamente, para todo valor dado de y, f(x, y) es una función 
lineal de x. En virtud de! teorema 4, esto significa que para todo y 
existe un vector 2, determinado univocamente, tal que la relación 
Fx, y) =(x, 2) es válida para cualesquiera valores de x. Indiquemos 
por 3 la aplicación que transforma y en z; entonces 


Fx, y) =(x, yB). (21) 
En el caso de un espacio bilineal métrico hermitiano tenemos 


Hs ay + By) =af (x, y) HBI, y) =a (x, Y, 0) 4+B (o yB) = 
= (x, a (yB) +P (4,8). 
Por otro lado, debido a (21), 


PO, ay, + Bua) = (x, (ay, + Bua) B). 
De aqui tenemos 


(ay + Bu) B=0 (4D) 4 B (vB), 


es decir, B es una aplicación lineal. Lo mismo tiene lugar en el 
caso de los espacios bilineales métricos corrientes. Indicando por 4 
la aplicación conjugada a la izquierda de 3, podemos representar (21) 
en la forma f(x, y)=(x4, y). Hemos obtenido, pues, el teorema 
siguiente: 

TEOREMA $. Sí £ es un espacio bilineal métrico no degenerado co~ 
rriente q hermitiano, la expresión (xA, y), donde A es una aplicación 
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lineal del espacio 2, representa una función bilineal corriente o her- 
mitiana, respectivamente, sobre È. Viceversa, para toda función bili- 
neal [(x, y) corriente o, respectivamente, hermitiana definida sobre € 
existe una aplicación lineal A de este espacio, determinada univoca- 
mente, tal que f(x, y) =(xA, y) para cualesquiera xe y de 2. 

El teorema 5 establece una correspondencia biyectiva entre las 
funciones bilineales y las aplicaciones lineales de los espacios bili- 
neales métricos no degenerados que permite reducir el estudio de 
las funciones bilineales al estudio de las aplicaciones lineales de 
estos espacios. Desde el punto de vista de la teoría de pares, el 
teorema 5 significa que el estudio de los pares de funciones bilinea- 
les, al menos una de las cuales es regular, puede ser reducido al 
estudio de los pares mixtos compuestos de una función bilineal 
regular y de una aplicación lineal. 

Veamos cómo están relacionadas las matricés de una función 
bilineal ie 4) y de su correspondienté aplicación lineal 4. Tome- 
mos en una base cualquiera sean y A las matrices de la 
función f f y) y de la aplicación Z, respectivamente. Tenemos, 
según la fórmula (6) del p. 24.1, 


F= lF [YY y (x4,=[x4]6 [yl = [x] AG [y], 
de donde 
F=AG, (22) 


donde G es la matriz de Gram del espacio £ en la basé escogida. 
Es fácil comprobar que esta fórmula tiene lugar también en el caso 
de los espacios bilineales métricos hermitianos. 

Una aplicación lineal 4 de un espacio bilineal métrico £ se 
llama simétrica si 


(A, y)=(x, yA) (23) 
cualesquiera que sean x e y de £. Una aplicación 4 se llama antisi- 
métrica si 

(x4, y) =—(X, YA). (24) 

Comparando (23) y (24) con las fórmulas que definen las aplicaciones 

conjugadas a la derecha y a la izquierda, obtenemos en lugar de 
(23) y (24) las relaciones equivalentes 

A=, (25) 

da tA. (26) 

Sea £ un espacio de métrica simétrica y sea 4 una aplicación 


lineal simétrica del espacio £, La función "bilineal correspondiente 
a la aplicación 4 es de la forma 


E, y) = (%4, y). 
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Si el espacio £ es corriente se tiene 
F = A, y) =(Y, xA) (yA, x)= f (Y, xy. 
Si el espacio L es hermitiano, tenemos respectivamente 


Fx, = (xA, y) =, xA) =A, x) =F y, 2). 
Por consiguiente, f(x, y) es en ambos casos una función simétrica. 
Los mismos razonamientos muestran que la simetria de f(x, y) 
implica la simetría de la correspondiente aplicación lineal 4. Aná- 
logamente, la antisimetría de la aplicación 4 equivale a la anti- 
simetría de la correspondiente función f (x, y). 

Si la métrica del espacio £ es antisimétrica, la relación entre 
la simetría y la antisimetría de las aplicaciones lineales y de las 
funciones bilineales es la inversa: a las aplicaciones simétricas les 
corresponden funciones antisimétricas y a las aplicaciones antisi- 
métricas les corresponden las funciones simétricas. Efectivamente, 
si æ es una aplicación simétrica de un espacio bilineal métrico 
corriente & provisto de una métrica antisimétrica, tenemos 


Fry) =A, y) =— (y, xd) =— (yA, x)= — f (4, x). 


Análogamente se demuestran las demás afirmaciones. Hemos llegado 
así al teorema siguiente: 


TEOREMA 6. Si L es un espacio no degenerado corriente o hermitiano 
provisto de una métrica simétrica, a las funciones bilineales simétri- 
cas les corresponden aplicaciones lineales simétricas del espacio & y a 
las funciones antisimétricas les corresponden aplicaciones antisimétri- 
cas. Si la métrica del espacio % es antisimétrica, al contrario, a las 
Funciones antisimétricas les corresponden aplicaciones simétricas y a 
las funciones simétricas les corresponden aplicaciones antisimétricas. 

Volviendo a la teoría de pares, vemos del teorema 6 que el 
estudio de los pares de funciones bilineales simétricas o antisimétricas 
equivale al estudio de las aplicaciones lineales simétricas o antisi- 
métricas en los espacios de métrica simétrica o antisimétrica. 


Ejemplos y problemas 
1. La matriz de Gram de un espacio métrico bilineal £ en una base ay, as, 

a, y a, es igual a 

t —3 7 —2 

tE? 

32 0 1 

4—1 5 
Demuéstrese que el subespacio isótropo a la izquierda de £ tiene la base 
a, +a,—ay y Sa, +6a,—7a, y que el subespacio Isótropo a la derecha tiene la 
base 2a, + 32d, Y A +a, — a, 
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2. Para que un espacio bilineal métrico se descomponga en una suma directa 
de subespacios ortogonales a ambos lados es necesario y suficiente que su matriz 
de Gram se descomponga en una base, 

3. Si la matriz de Grom de un espacio bilineal métrico no degenerado € 
es G, la aplicación lineal de matriz 0'G=1 del espacio Ñ es un amtomorfismo 
del mismo, 

4. Demuéstrese que cualquiera que sea un subespacio no degenerado Ñ de 
un espacio bilineal métrico £, las dimensiones de UL y de 2% son iguales a la 
diferencia de las dimensiones de L y de Y. Demuéstrese, en particular, que 
Hat) (20) LL. 

5. Todo espacio provisto de una métrica simétrica o antisimétrica es una 
suma directa de unos subespacios isótropo y no degenerado. 

6. Si en un espacio bllineal métrico É son equivalentes los conceptos de 
ortogonalidad a la derecha y a la izquierda, £ es o bien un espacio de métrica 
simétrica o bien un espacio de métrica antisimétrica, 

7. Las funciones p que cumplen la identidad 


By (axt y) + op (x — By) = (1 +28) (ap (2) + By (y) 


y sólo estas funciones, son cuadráticas sobre un espacio lineal 

8, Sea / una matriz cuadrada fija. Una matriz A se llama /-orfogonal, si 
AlA'=1, se llama I-simétrica, si AI=1A", y se lama /-antisimétrica, si 
A/=— 14'. Demuéstrese que si en una base de un espacio bilineal métrico la 
matriz de Gram coincide con /, en esta base las aplicaciones isométricas tienen 
matrices /-ortogonales y las aplicaciones simétricas y antisimétricas tienen ma- 
trices /-simétricas e /-antisimétricas, respectivamente. 


A. zz a aai 


Capítulo VII Aplicaciones lineales 
de espacios bilineales 
métricos 


En el capítulo presente será considerada la clasificación de los 
principales tipos de aplicaciones lineales (simétricas, . antisimétricas 
e isométricas) de espacios provistos de métrica bilineal. La relación 
que existe entre esta clasificación y la clasificación de los pares de 
formas bilineales ha sido explicada en el $ 24 del cap. VI y se 
supone que el lector que pase al estudio de este capítulo está fami- 
liarizado con los resultados de aquel parágrafo. 

En este capitulo, al igual que en el anterior, se supone que 
todos los espacios que aquí aparecen son espacios sobre un cuerpo 
conmutativo (pero no sobre un cuerpo cualquiera). 


$ 25. Tipos principales de aplicaciones lineales 


25.1. Automorfismos. Según el p. 24.2, una aplicación lineal 
regular 4 de un espacio bilineal métrico £ se llama automorfismo 
del espacio £, si U no altera la magnitud del producto escalar, es 


decir, si 
CU, yu) =(x, y) (i) 


pa todos los x e y de £. Los automorfismos del espacio & tam- 
ién se llaman a veces aplicaciones isométricas del mismo. Empleando 
los conceptos de las aplicaciones conjugadas a la derecha y a la 
izquierda, podemos representar la relación (1) en la forma 


(e, y) =U, YU) = (x, YUU) = KUU, y), 
de donde se tiene 


uUw=wu=s. (2) 


Está claro que, recíprocamente, la relación (2) implica la relación (1). 
Por consiguiente, para que una aplicación lineal UL de un espacio 
bilineal métrico no degenerado sea: un automorfismo es necesario y 
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suficiente que ambas aplicaciones conjugadas de Uù coincidan con la 
inversa de U. 

Tomemos en una base e indiquemos por U la matriz de la 
aplicación YU. Si el espacio es corriente, la relación (1) se con- 


vierte en 
[x] UGU" [y)' =[x] G [y]", 
donde G es la matriz de Gram. De aquí resulta 
UGU’ =G. (3) 
Si el espacio Q es hermitiano, de (1) se tiene 


3 UGT [3] =[x] 6 1", 
es decir, AS 
. UGU’ =G. (4) 


Las igualdades (3) y (4) representan las condiciones que deben 
cumplir las matrices de las aplicaciones isométricas de los espacios 
bilineales métricos no degenerados corrientes y hermitianos, respec- 
tivamente. 

Dos aplicaciones lineales 4, y 4, de un espacio bilineal métrico £ 
se llaman isomorfas, si existe una aplicación isomoría U del espacio L 
sobre sí mismo que transforma 4, en 4, Tenemos, de acuerdo con 


el p. 10.2, 
A SUAU. (5) 


La aplicación U es un automorfismo del espacio £ y, por ello, la 
relación (5) significa que el isomorfismo de las aplicaciones lineales 
de espacios bilineales métricos equivale a la semejanza de las mismas 
respecto a las aplicaciones isométricas. De aqui se deduce, en virtud 
de los resultados del p. 15.3, que las aplicaciones lineales isomorfas 
tienen factores invariantes iguales. En el caso general, este criterio 
no es suficiente para el isomorfismo de unas aplicaciones. Sin em- 
bargo, la situación es diferente, si se consideran aplicaciones simé- 
tricas, antisimétricas o isométricas. 

TEOREMA 1. Sea L un espacio no degenerado corriente sobre el cuerpo 
de todos los números complejos provisto de una métrica simétrica o 
antisimétrica. Entonces para el isomorfismo de unas aplicaciones si- 
métricas, antisimétricas o isométricas del espacio Q es necesario y 
suficiente que los factores invariantes de estas aplicaciones coincidan. 

La necesidad ha sido demostrada anteriormente y, por esto, con- 
sideraremos sólo la suficiencia. Sean 4, y 4, las aplicaciones lineales 
dadas. Por hipótesis, los factores invariantes de 4, y de 4, coin- 
ciden y, por consiguiente, 


hyf AS, (6) 
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donde Y es una aplicación lineal regular del espacio £. Pasando en 
ambos miembros a las aplicaciones conjugadas, obtenemos 

ATP ATA, (7) 
Si 4, y A, son simétricas o antisimétricas, se tiene 4} =+ 4, y 
A= A, y (7) se convierte en 

ATA ST (8) 
En cambio, si Æ, y 4, son isométricas, tenemos i= A4 
A= Az. Introduciendo estos valores en (7) y elevando el resultado 
a la potencia —!, obtenemos de nuevo (8). Debido a (6) y (8) 
tenemos FAT =F *A,F*"*, de donde 

MITIS- A, 9) 
De (9) se desprende directamente que 
AANTIVATIYP A, (k=l, 2...) 
y, en general, 
AUHITT) TT") Ar, 

donde f (à) es un polinomio arbitrario (compárese con el p. 23.2). 


Según el teorema sobre la extracción de la raíz cuadrada (p. 16.3), 
el polinomio f (à) se puede escoger de modo que 


HEIVI I= F". 
Tomando 
DENTT) y USsDAS, 
obtenemos 
D=|f ITN =f TTD, 
WED AT DA, 
UW=D II’ D =D ITF D =D DPD UE. 


Por consiguiente, YU es una aplicación isométrica. Al mismo tiempo 
de 4,D=WD4, se deduce que Š 


UDA US TI DADS =I ADD I =T AS =A, 


que es lo que se quería demostrar. 

El teorema 1 muestra que en los espacios euclídeos complejos, 
así como en los espacios complejos simpliciales, para clasificar, 
salvo un isomorfismo, las aplicaciones simétricas, antisimétricas e 
isométricas es suficiente saber qué divisores elementales pueden 
contener estas aplicaciones. 


» Como la métrica de £ es simétrica o antisimétrica, las aplicaciones con- 
jugadas a la derecha y a la Izquierda coinciden. 
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TEOREMA 2. Si una aplicación isométrica U de un espacio bilineal 
métrico no degenerado corriente Y contiene k veces el divisor elemen- 
tal (\—a)”, la aplicación U contiene también k veces el divisor ele- 
mental (Aa Y”. 
La afirmación del teorema no tiene contenido para a ==> 1. Por 
esto aceptaremos que «2 +1. Tomemos en Y una base e indiquemos 
r U la matriz de la aplicación Q. En virtud de (3), tenemos 
GU’ =G, donde G es la matriz de Gram. De aquí resulta 


U'=G"U-G. (10) 


Los divisores elementales de la matriz U’ coinciden con los divisores 
elementales de la matriz U. La fórmula (10) muestra que, a su 
vez, los divisores elementales de la matriz U’ coinciden con los 
divisores elementales de la matriz U—* (compárese con el p. 15.3). 
Es decir, los divisores elementales de la matriz U deben ser los 
mismos que los de Ja matriz U”!, Pero, según el teorema sobre 
los divisores elementales de las funciones (p. 16.4), los divisores 
elementales de la matriz U~? se obtienen de los divisores elemen- 
tales (——a)” de la matriz U sustituyendo æ por a”!. Por consi- 
guiente, si en todo divisor elemental de tipo (A—a)” ae la matriz U 
sustituimos a por a”!, obtendremos de nuevo un divisor elemental 
de la matriz U que es lo pe se quería demostrar. 

En el caso de espacios bilineales métricos hermitianos la rela- 
ción (10) se convierte en 


U =G- UG. 


Con arreglo a esto también cambia ła afirmación sobre los divisores 
elementales: si (A—a)” es un divisor elemental de multiplicidad k de 
una aplicación isométrica de un espacio bilineal métrico no degenerado 
hermitiano, la expresión (1—a”")” también será un divisor elemental 
de multiplicidad k de esia aplicación. La demostración es la misma. 

TEOREMA 3, Sean a y b dos vectores radicales de una aplicación 
isométrica U de un espacio bilineal métrico corriente &. Si los va- 
lores propios œ y B, a los que corresponden estos vectores, no son 
reciprocamente inversos, es decir, si «$ =f 1, los vectores a y b son 
ortogonales. Análogamente, si Q es un espacio bilineal métrico hermi- 
tiano y aB=e 1, los vectores a y b son también ortogonales. 

La demostración es la misma tanto para los espacios corrientes 
como para los hermitianos. Por esto consideraremos sólo los espacios 
corrientes. Por hipótesis, 


alab — UF =0 y MBSU!=0 (ap #1), (1) 


donde s y f son unos números enteros no negativos. Debemos de- 
mostrar que de las relaciones (11) se desprende la igualdad (a, b)=0. 
Realizaremos la demostración por inducción según los valores de 
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la suma s+1. Si s+1=0, se tiene s =£=0 y de las relaciones (11) 
resulta a=b =o, de donde (a, b)=0. 

Supongamos ahora que tenemos dado un valor de la suma s +1 
y que para todos los valores menores que esta suma la afirmación 
ha sido ya demostrada. Tomemos 


a(a8—U) =a, y bBÉ—U) =b, 
a, (a8 — U- =a (a8 —U)=0, 
b, (BE—U)'- =b (PE — U) =0, 
tenemos por inducción 
(a, bi) = (@, b)=(4,, b) =0. 
Pero la igualdad (a, b,)=0 implica que (a, b (PBE —U)) =0, es decir, 


Puesto que 


(a, DU) =P (a, b). (12) 
Análogamente, de la igualdad (a,, b)==0 se deduce: 
(aU, b) =a (a, b). (13) 


Finalmente, de la igualdad (a,, b,)=0 resulta: 
O=(a (a8 — U), b (BE —W) = 
= ap (a, b)—a (a, OU)—P (aU, b)+ (aU, bU), 
de donde, debido a (12) y (13), obtenemos 
=— af (a, b)+ (a, b). (14) 


o que a1, la igualdad (14) ofrece la relación requerida 
(a, b) =0. 

TEOREMA 4 Si 4 es una aplicación isométrica, simétrica o anti- 
simétrica del espacio 2 y el subespacio U es invariante respecto a A, 
los subespacios ortogonales a A a la derecha y a la izquierda son 
también invariantes respecto a A. 

Sea 4 una aplicación isométrica del espacio @. El subespacio 
ortogonal a la derecha Mt está formado por los vectores b que 
cumplen la relación (a, b)=0 cualquiera que sea a de A. Puesto 
que 4 es una aplicación regular, el subespacio A es invariante 
también respecto a 472. Por consiguiente, el vector a47! perte- 
nece a A, de donde tenemos (a4”!, b)=0. Pero 


(44, b)= (4AA, bA)=(0, bA), 


es decir, (a, b4)=0 para todo a de A. Por consiguiente, el vector 
bA figura en MÈ y el subespacio AL es invariante respecto a 4. 
También sencillas son las demostraciones de las demás afirmaciones. 

TEOREMA $. Supongamos que un espacio bilineal métrico corriente 
o hermitiano % se descompone en una suma directa de sus subespactos 
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2, £,, ..., L, ortogonales a ambos lados. Si todos estos subes- 
pacios son invariantes respecto a una aplicación lineal A del espacio Y 
y si la aplicación A es isométrica o, respectivamente, simétrica o 
antisimétrica sobre cada uno de los subespacios L,, ..., L,, la apli- 
cación A será del mismo tipo sobre el espacio €. 

Este teorema explica cómo pueden emplearse las descomposi- 
ciones directas para el estudio de las propiedades de las aplicacio- 
nes lineales de los tipos señalados. Su demostración es evidente y 
queda a cargo del lector. 


25.2. Aplicaciones simétricas y antisimétricas. Recordemos que 
una aplicación 4 de un espacio bilineal métrico corriente o hermi- 
tiano se llama simétrica si 


(A, y) =(x, yA) 


para cualesquiera x e y de Q. 

TEOREMA 6, Los vectores radicales a y b correspondientes a dife- 
rentes valores propios p y o de una aplicación simétrica A de un 
espacio bilineal métrico corriente o hermitiano son ortogonales. 

Efectivamente, tenemos, por hipótesis, 

apé—A)=0 y b(0é—4A) =0, (15) 
donde s y f son unos números enteros no negativos. Debemos de- 
mostrar que de (15) se desprende la ortogonalidad de los vectores 
a y b. Realizaremos la demostración por inducción según los valo- 
res de la suma s+1. Para s+f=1 o bien s o bien / es igual a 
cero y, por consiguiente, o bien a=0 0 bien b=0, de donde (a, b) = 0. 

Supongamos ahora que tenemos dado un valor de la suma s-+ f 
j que para todos los valores menores que esta suma la afirmación 

a sido ya demostrada. Sea 


a =a(pé—A) y b,=b(06—A). 


Tenemos 
a (08 — 4)" =a (06 —4A)'=0, 
08 AJA =b (08 —4)' = 0. 
Por esto, de acuerdo con la hipótesis de inducción, resulta 
(a, 6,)=(a,, b)=0, 


es decir, 
o(a, b)=(a, b4) y pla, b)=(ad, b). 


Puesto que la aplicación Z es simétrica, los segundos miembros de 
estas igualdades coinciden y, por consiguiente, (a—p)(a, b) -+0, de 
donde se tiene (a, b)=0 que es lo que se quería demostrar 
Una aplicación .4 de un espacio bilineal métrico corriente que 
cumple la relación 
(wA, y) =—(%, yA) 
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para todos los x e y de 2 se llama, de acuerdo con el p. 24.3, 
antisimétrica. 

TEOREMA 7. Sean a y b unos vectores radicales de una aplicación 
antisimétrica de un espacio bilineal métrico corriente correspondientes 
a los valores propios p y o. Si p+03%0, se tiene (a, b)=0. 

La demostración coincide casi textualmente con las demostra- 
ciones análogas de los teoremas 3 y 6 y puede ser aquí omitida, 

Las a isométricas de un espacio bilineal métrico no 
degenerado cualquiera £ están estrechamente ligadas a las aplica- 
ciones antisimétricas del mismo. Tiene lugar concretamente el si- 
guiente teorema que, por la forma en la que se enuncia, coincide 
plenamente con el teorema del p. 20.3 sobre la aplicación de Cayley. 

TEOREMA 8. Sea Q un espacio bilineal métrico corriente o hermi- 
tiano. Si A es una aplicación antisimétrica del espacio % que no 
tiene valores propios iguales a —1, la aplicación 


US (E—A) E +A)" (16) 


es una aplicación isométrica del espacio £ que tampoco tiene valores 
propios iguales a —1 y, además, 4 se expresa mediante U por la 
fórmula 


A=($—U) ($ +U. (17) 


Reciprocamente, sí U es una aplicación isométrica del espacio & 
que no tiene valores propios iguales a —l, la aplicación A calcu- 
lada mediante la fórmula (17) es antisimétrica y tampoco tiene va- 
lores propios iguales a —1 y U se expresa en términos de A median- 
te la fórmula (16). 

Igual que en el caso de espacios unitarios, las fórmulas (16) y 
an) Hevan el nombre de aplicaciones de Cayley. La demostración 
de las mismas coincide textualmente con la demostración de estas 
fórmulas realizada en el p. 20.3 para los espacios unitarios. Por 
esto omitimos aquí la demostración. Observemos que unas fórmulas 


análogas 
U= (E—A) (E+ 4), (18) 
A=(E +U) (EU: (19) 


ofrecen una correspondencia entre las aplicaciones antisimétricas 
del espacio que no tienen valores propios iguales a —1 y las 
aplicaciones isométricas del espacio que no tienen valores propios 
iguales a +1. 

Las aplicaciones de Cayley podrían reducir totalmente el estudio 
de las aplicaciones isométricas al estudio de las antisimétricas, sl 
no figurasen los valores propios excepcionales +1. La existencia 
de estos valores hace necesario el estudio independiente más dela- 
ltado de las propiedades de las aplicaciones isométricas. 

Para terminar demostremos que tiene lugar el teorema signiente: 
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TEOREMA o. Si (A—a)” figura k veces en el sistema de divisores 
elementales de una aplicación antisimétrica A de un espacio bilineal 
métrico no degenerado corriente £, la expresión (A+ a)” también 
figura k veces en el sistema de los divisores elementales de la apli- 
cación A. 

Efectivamente, la matriz B de la aplicación conjugada 4* satis- 
face la relación (19) del p. 24.3: 


B'=G "AG, 


donde G es la matriz de Gram y A es la matriz de la aplicación 4. 
De aquí se ve que los divisores elementales de la matriz B coin- 
ciden con los divisores elementales de la matriz A. Sin embargo, 
de la condición de antisimetría se deduce que B=— A; por con- 
siguiente, cambiando el signo de œ en cada uno de los divisores ele- 
mentales (——a)" de la aplicación A, obtendremos de nuevo unos 
divisores elementales de la aplicación Æ que es lo que se quería 
demostrar. 


Ejemplos y problemas 


1. Sea Y una aplicación de un espacio bilineal métrico no degenerado £ 
sobre si mismo que conserva el producto escalar (aU, 6) =(a, b). Demuéstrese 
que & es una aplicación lineal y, por consiguiente, isométrica del espacio £. 

2. Los determinantes de las aplicaciones “isométricas de los espacios bili- 
neales mélricos no degenerados corrientes son iguales a + 1 y los determinantes 
de las aplicaciones isométricas de los espacios bilineales métricos no degenerados 
hermitianos son de módulo igual a la unidad. 

3. En lodo espacio bilineal métrico no degenerado £ existe una aplicación 
lineal & que satisface la condición (x, y)= (y4, x) si Les un espacio corrien- 
te, y la condición (x, y)=lyéF, x), si L es un espacio hermitiano. Demués- 
trese que la aplicación & es iSométrica y que su matriz es igual a G'G-L o 
G'G=1 según sea Q un espacio corriente o hermitiano (G es una matriz de Gram 
del espacio £). 

4. Si en un espacio bilineal métrico no degenerado corriente Y coinciden 
las aplicaciones conjugadas a la derecha y a la izquierda de cualqpuier aplica- 
ción lineal, la métrica del espacio € es simétrica o antisimélrica. 
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En el parágrafo presente y en los dos que le siguen examina- 
remos más detalladamente las formas elementales a las que pueden 
ser reducidas las matrices de las aplicaciones simétricas, antisimé- 
tricas e isométricas de los espacios euclídeos, simpliciales y seudo- 
unitarios sobre el cuerpo de los números complejos; estos últimos 
han sido clasificados de un modo completo al final del p. 24.2. 
Notemos que se traturá de determinar las formas elementales de las 
matrices de las aplicaciones en unos sistemas especiales de coorde- 
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nadas con la matriz de Gram bien definida, ya que sólo en esta 
condición se conocen, salvo un isomorfismo, las aplicaciones. En 
el caso de los espacios euclídeos unitarios y reales este problema 
ha sido resuelto en el cap. V. Para el sistema especial de coorde- 
nadas ha sido escogido en aquella ocasión un sistema ortonormal 
de coordenadas en el que la matriz de Gram es la matriz unidad. 
En el caso de espacios de tipo más complejo es preferible tomar 
para los sistemas principales o normales de coordenadas sistemas 
de coordenadas con una matriz de Gram de estructura más com- 
pleja. Comenzaremos por el estudio de un espacio euclídeo complejo. 


26.1. Aplicaciones simétricas. Como ya hemos señalado, se llama 
espacio euclideo ca un espacio no degenerado sobre el cuerpo 
de los números complejos provisto de una métrica simétrica corrien- 
te. La matriz de Gram de un espacio euclideo complejo es regu- 
lar y simétrica, Recíprocamente, todo espacio bilineal métrico 
complejo con la matriz de Gram regular simétrica es un espacio 
euclídeo complejo. Pero todos los espacios euclídeos complejos de 
una dimensión 1 dada son isomorfos y por esto en todo espacio de 
esta índole existe un sistema de coordenadas con una matriz de 
Gram simétrica regular cualquiera dada de antemano, En ea 


en todo espacio euclideo complejo £ existe un sistema de coorde- 
nadas A, a, ..., 2, en el que la matriz de Gram es de la forma 
fO0...01 


as n 
AE) 


Convendremos en llamar normal todo sistema de coordenadas que 
tenga esta matriz. Los vectores de un sistema normal de coordena- 
das satisfacen las relaciones 


(ap Ars =1, (0, 44) =0 
G+ken+L j, k=l, n), 


que también son suficientes para que un sistema sea normal. 

La conveniencia de las bases normales se determina por la si- 
gulente propiedad de las mismas: toda aplicación lineal, cuya ma- 
triz en una base normal es una célula de Jordan, es simétrica. 

Efectivamente, por lo visto en el p. 24.3, una aplicación Z es 
simétrica si es simétrica la matriz AG, donde G es la matriz de 
Gram de la base y A es la matriz de la aplicación 4 en esta base. 
Pero realizando directamente los cálculos se puede ver que al mul- 
tiplicar una célula de Jordan de orden n por la matriz G se obtiene 
una matriz simétrica. 

Esta observación permite demostrar inmediatamente el siguiente 
teorema principal: 


. (0) 


(2) 
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TEOREMA 1. Sea dado un sistema arbitrario de expresiones de tipo 
(A—Py)", -. ., (A—P,)"". En todo espacio euclideo complejo de dimen- 
sión n=m,+ ... +m, existe entonces necesariamente una aplicación 
simétrica A para la cual las expresiones señaladas constituyen el sis- 
tema completo de sus divisores elementales. 

En electo, pongamos 


(3) 


donde los órdenes de las matrices G, y A, son iguales a my 
(¡=1, ..., s). Sea 


G=G,4... +6, y A=A,+...+Az (4) 


En un espacio euclídeo complejo L de dimensión n existe una base 
de matriz de Gram igual a G. Indiquemos por 4 la aplicación 
lineal de matriz A en la base señalada. Debido a la observación 
hecha anteriormente, la matriz AG es simétrica y con ella es si- 
métrica también la aplicación 4. Al mismo tiempo de (3) y de (4) 
se ve que 4 tiene el conjunto requerido de divisores elementales. 

En virtud del teorema 1 del p.25.1, el teorema demostrado 
resuelve completamente el problema sobre la clasificación, sulvo un 
isomorfismo, de todas las aplicaciones simétricas de' un espacio 
euclídeo complejo. En particular, de él se desprende el teorema 
siguiente: 

TEOREMA 2. Sea A una aplicación simétrica de un espacio euclideo 
complejo &. Entonces, Ẹ se puede descomponer en una suma directa 
de subespacios reciprocamente ortogonales invariantes respecto de A y 
tales qué en cada uno de ellos existe una base normal en la que la 
matriz de la aplicación inducida por la aplicación «l será una célu- 
la de Jordan. 

Para la demostración indiquemos por (A—p,)" 
el conjunto de los divisores elementales de la apiicación «4. Tome- 
mos en £ una base a, ..., a, tal que su matriz de Gram sea 
igual a la matriz G de (4), y sea B la aplicación lineal de matriz A 
de (4) en la base a,, ..., a, Las aplicaciones 4 y B son simé- 
tricas y semejantes. En virtud del mencionado teorema 1 del 
p. 25.1, de aquí se deduce que existe una aplicación isométrica Y 
tal que 4= UBU”!. Entonces, Ja matriz de la aplicación 4 en la 


po A Je 


base a/U, ..., a,U coincidirá con la matriz de la aplicación B en 
la base a, ..., Gw es decir, coincidirá con la mat.iz A. Al mismo 
tiempo, la matriz de Gram de la base a,U, ..., al es G y para 


la aplicación ® las afirmaciones del teorema 2 so evidentes. 
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En una base ortonormal la matriz de una aplicación simétrica 
es simétrica. Por ello, del teorema 1 se deduce que existen matrices 
complejas simétricas de cualquier conjunto de divisores elementales. 


26.2 Aplicaciones antísimétricas. Sea Z una aplicación antisi- 


métrica de un espacio euclideo complejo £. Descompongamos & en 
la suma directa de los subespacios radicales 


L= 8p +24... blo. 


Agrupando los sumandos que corresponden a pares opuestos de valores 
propios, obtenemos una nueva descomposición de Y: 


L=M 4M, +... EM, 


donde M, es el subespacio radical correspondiente a la raíz cero 
y Myli=1, ..., £) son sumas de tipo 2,+2.,. El teorema 7 del 
p.25.2 muestra que los subespacios W,, Mi, son reciprocamente 
ortogonales y, además, son invariantes respecto de 4. Por esto el 
estudio del comportamiento de «£ sobre Y se reduce al estudio del 
comportamiento de esta aplicación sobre los espacios M,, M,, ..., My 
gor separado. Consideremos más detalladamente el subespacio M,. 
upongamos que M, es diferente de cero e indiquemos por 4, la 
aplicación inducida en Wè, por ta aplicación .4. Puesto que todos 
los valores propios de la aplicación 4, son iguales a cero, se tiene 
«4 =0, donde p es la dimensión de Mi,. Indiquemos por m la me- 
nor potencia de la aplicación 4, que se convierte en cero: 4A% =60 
y A06. Consideremos dos casos: el de m par y el de m impar. 
Sea m par; entonces m—1 es impar y la aplicación «(3-1 es anti- 
simétrica. La función bilineal (x.4g=!, y) es también antisimétrica. 
Puesto que esta función es diferente de cero, en Di, existe un par 
de vectores a y b para el cual 


(aig, b)= 
De la antisimetría de la aplicación «4, se desprende que 
(ath, bay =— (0447, bA) =.. (—1)* (a, bAt), 
En particular, se tiene (a, bg") =(—1)"-' (a4%7, b)=—1, es 
decir b43~t 0. Pongamos 
aca, mSme ... 
b,=0, b=bto - 
Las relaciones 
(ars anpi) =(— 1) (a, ado 
(ar, basima) = (— 1)" 
f+i>mel k, j 
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muestran que la matriz de Gram de esta base es de la forma 
Eae AS 


donde en cada una de las cuatro células todos los elementos que 
figuran debajo de la diagonal secundaria son iguales a cero. El 
determinante de tal matriz es igual a +1 y, por consiguiente, el 
subespacio X, tendido sobre los vectores a, `... 
no degenerado. Debido al teorema 2 del p. 24: 


M,=N,+Nf, 


siendo Ni de nuevo un subespacio invariante respecto de 4. 

Consideremos el caso en que m es impar. La aplicación 17" es 
ahora simétrica y, por consiguiente, es simétrica su correspondiente 
función bilineal” (x.4g=", y). Puesto que esta función no es igual 
idénticamente a cero, existe un vector a tal que (a4g", a) #0, 
Pongamos 


0/=4, =A +», On = Ol y. 


El subespacio M, tendido sobre los vectores a,, ..., a, es invarian- 
te respecto de 4,. Su matriz de Gram en el sistema de coorde- 
nadas a, ..., a, es de la forma 


(an a) oe (ls Omma) (rs Op) 
ua (a, a) ee (O ami) o i 
Lan, a) .. 0 0 
Efectivamente, 


(ap a= (aA, adi” 
para ¡+k>m-+-1. Además 
(A, Aa) =— (As, am) = -= (am, 4)=0 50, 


De aquí se ve que la matriz G es regular; por consiguiente, el 
subespacio 9, es no degenerado y tenemos de nuevo 


M, =N, Ni, 


donde Nt es invariante respecto de 4. 

Es decir, hemos despejado de M, un subespacio N, que en el 
primer caso representa una suma de dos subespacios de dimensión 
par y en el segundo caso es un subespacio de dimensión impar. 


DA (aait, a) = 0 
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Aplicando este mismo procedimiento al subespacio complementario 
Nt podremos descomponerlo de nuevo en una suma directa de sub- 
espacios invariantes, etc. El espacio Mi, resultará descompuesto 
de esta forma en una suma directa de subespacios invariantes, cada 
uno de los cuales será o bien una suma directa de dos subespacios 
de dimensión par o bien un subespacio de dimensión impar. En esta 
descomposición a todo subespacio corresponde un divisor elemental 
de la aplicación 4, de forma A”, donde p es la dimensión del 
subespacio. Por consiguiente, toda aplicación anfisimétrica de un 
espacio euclideo complejo contiene un número par de veces a todo 
divisor elemental de tipo A. Este resultado, así como el teorema 
7 del p. 25.2, imponen ciertas condiciones al sistema de divisores 
elementales de una aplicación antisimétrica. Demostremos que estas 
condiciones son suficientes para la existencia de una aplicación 
antisimétrica. 

TEOREMA 3. Las aplicaciones antisimétricas de los espacios eucli- 
deos complejos contienen los divisores elementales correspondientes a los 
valores propios no nulos en forma de pares (A—a)”, (A+a)”, los 
divisores elementales de tipo AP también en forma de pares AP, AP para 
p par y los divisores elementales de tipo ÀP para p impar en com- 
binaciones arbitrarias, Reciprocamente, todo conjunto formado por un 
número finito de expresiones de tipo (ì—a;)™ que cumple estas con- 
diciones, es un sistema de divisores elementales de una aplicación 
antisimétrica de un espacio euclideo complejo de dimensión adecuada. 

La primera parte de esta proposición ha sido ya demostrada. 
Por ello, para obtener la demostración completa del teorema debe- 
mos construir para cualquier sistema de expresiones, que cumple 
las condiciones del teorema, la correspondiente aplicación antisimé- 
trica. Por o: con el punto anterior esto se puede lograr del 
modo siguiente. À todo par de expresiones (A—a;)™ , (A+ 0) y entre 
ellos a los pares con «,=0 ponemos en correspondencia las matrices 


[5,9] y a-[8-2). 


donde D, es una matriz simétrica normal de tipo (1) del p. 26.1 
y B, es la célula de Jordan de orden m; y con el valor propio aj. 
Si entre las expresiones dadas figuran expresiones A2%-1 que no 
forman pares, les ponemos en correspondencia las matrices 


rol 00.. 
0—10. 
01 


J 


20—1843 


306. Cap. VII. Aplicaciones lineales de espacios 


de orden 2s;— 1. Sea 
G=G,+... +G, y A=A,+...+4As 5) 


Indiquemos por £ un espacio complejo de matriz de Gram igual a G. 
Puesto que G es una matriz simétrica regular, el espacio £ es 
un espacio complejo euclideo. Consideremos la aplicación lineal 4 
del espacio £, cuya matriz es A. La función bilineal correspondien- 
te a la aplicación 4 tiene la matriz AG con la particularidad 
de que 
AG=A4,6,+...+4,6,. 


Los cálculos directos muestran que las células A/G,, y por ello 
también la matriz AG, son antisimétricas. Por esto la función 
bilineal y la aplicación £ son también antisimétricas. Se ve, de 
la forma de la matriz A, que los divisores elementales de la apli- 
cación uf tienen los valores requeridos. 

Según el teorema 1 del p. 25.1, todas las aplicaciones antisimé- 
tricas de un espacio euclideo complejo que tengan sistemas iguales 
de divisores elementales son isomorías. Luego, del teorema 3 se de- 
duce que para toda aplicación antisimétrica 4 de un espacio 
euclídeo mpk 2 existe un sistema de coordenadas en el que la 
matriz de Gram G y la matriz A de la aplicación son de la 
forma (5). 


26.3. Aplicaciones ortogonales complejas. Las aplicaciones iso- 
métricas de un espacio euclídeo complejo £ suelen llamarse aplica- 
ciones ortogonales complejas. Si en % se ha tomado un sistema de 
coordenadas de matriz de Gram G, las matrices U de las' aplicacio- 
nes ortogonales, y sólo estas matrices, satisfacen la relación 


UGU'=0. (6) 


En particular, si el sistema de coordenadas es ortonormal, se tiene 
G=E y (6) se convierte en 


UU'=E. 


En otras palabras, en un sistema ortonormal de coordenadas las ma- 
trices de las aplicaciones ortogonales son ortogonales. 

Las aplicaciones ortogonales con los divisores elementales iguales 
son, según el teorema 1 del p. 25.1, isomorfas. Por esto para la 
clasificación de las aplicaciones ortogonales es suficiente indicar qué 
sistemas de expresiones de tipo (A—a,)" pueden servir como sis- 
temas de divisores elementales de las aplicaciones ortogonales. El 
esquema de la solución de este problema es el siguiente: conocemos 
los divisores elementales de las aplicaciones antisimétricas; las apli- 
caciones ortogonales se pueden expresar en términos de las antisi- 
métricas mediante las fórmulas de Cayley (p. 25.2); por consiguiente, 
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empleando el teorema sobre los divisores elementales de las funciones 
matriciales (p. 16.4), podemos encontrar también los divisores ele- 
mentales de las aplicaciones ortogonales. Sin embargo, al realizar 
este esquema debe tenerse en cuenta la existencia de los valores 
excepcionales en las fórmulas de Cayley, debido a lo cual la solu- 
ción adquiere la forma siguiente, algo más voluminosa. 

Sea U una aplicación ortogonal de un espacio euclideo complejo ?. 
Representando Y en la forma de la suma directa de los subespacios 
radicales de la aplicación Y y agrupando los subespacios correspon- 
dientes a valores propios reciprocamente inversos, obtendremos la 
descomposición 


LM, MEM, FM, 


donde todos los WM) son recíprocamente ortogonales y, además, WM, 
y M, son los subespacios radicales de la aplicación YU correspon- 
dientes a los valores propios — 1 YA 1. La aplicación % induce 
en cada uno de los subespacios Dt, una aplicación ortogonal U; 
y, Jos divisores elementales de la aplicación U se descomponen en 
los sistemas de divisores elementales de estas aplicaciones inducidas. 
Consideremos la aplicación U,. Todos sus valores propios son igua- 
les a +1.. La fórmula de Cayley 


A =(E6- U) (EF UY 


transforma %, en una aplicación antisimétrica 4,. Representemos 
esta fórmula en la forma æ, =f(U,), donde f (à) =(1 —A) (1 +A)". 
Puesto que la derivada de f(A) no se anula para à= l, resulta 
(p. 16.4) que introduciendo en todo divisor elemental (A—a)" de la 
aplicación U, en lugar de a el número (1—a)(l +a)"*, obtendre- 
mos los divisores elementales de la aplicación .2,. Pero los divisores 
elementales de la aplicación Y, son de la forma (— 1)*; por consiguien- 
te, los divisores elementales de la aplicación 4, son de tipo A, Si s es un 
número par, las aplicaciones antisi ricas contienen todo divisor 
elemental de tipo A* un número par de veces y por esto la aplica- 
ción U, contiene todo divisor elemental de tipo (A—1)* también 
un número par de veces, sí s es par. 
Aplicando la fórmula de Cayley 


A=(E8+U) ($Uy" 


a la aplicación %..,, obtendremos, de forma análoga, que la aplica- 
ción % contiene todo divisor elemental de tipo (4+-1)* también un 
número par de veces, si s es par. 

TEOREMA 4. Los divisores elementales de las aplicaciones ortogonales 
complejas correspondientes a los valores propios diferentes de + 1 
aparecen en pares de tipo (A—0)”, (A—a”!)”; los divisores elemen- 
tales de tipo (à+ 1}! aparecen un número par de veces y los di 
sores elementales de tipo (à+ 1)"*! aparecen en combinaciones arbi- 


20* 
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trarias. Reciprocamente, todo sistema de expresiones de tipo (A—«¿)m 
(u0) que cumple estas condiciones es un sistema de divisores 
elementales de una aplicación ortogonal compleja. 

La primera parte del teorema ha sido ya demostrada. Suponga- 
mos, por ello, que tenemos un sistema de divisores elementales de 
tipo (A—0¿)i(a,>4 0) que satisface las condiciones del teorema. 
Separamos en este sistema los divisores elementales de tipo (A-+ 1)? 
y para cada uno de los divisores elementales (A—a,) que quedan 
construimos la expresión (A—B¿y", donde B,=(1—ap)(l-+a). 
El sistema de las expresiones (A—P¿) cumplirá las condiciones 
del teorema 3 y, por consiguiente, será un sistema de divisores 
elementales de una aplicación antisimétrica 4, de un espacio euclídeo 
complejo £,. Puesto que hemos tomado solamente valores de œ; dife- 
rentes de —1, todos los f, serán también diferentes de —1. Em- 
pleando para ut, la aplicación de Cayley, obtenemos una aplicación 
ortogonal U, con los divisores elementales (A—a)"i (a; — 1). 
Análogamente, para todo divisor elemental de tipo (A + 1) tomamos 
la expresión A" y buscamos una aplicación antisimétrica «4, de un 
espacio ę, cuyos divisores elementales sean 2%, Entonces la 


aplicación 
U= — (EA) E+ A) 


será una aplicación ortogonal del espacio L,, cuyos divisores ele- 
mentales son (A-+ 1). Tomemos en £, y en & unos sistemas orto- 
normales de coordenadas e indiquemos por U, y U, las matrices 
de las aplicaciones Y, y U,. Estas matrices serán ortogonales y por 
ello la suma directa U,+U,=U de las mismas también será una 
matriz ortogonal. 

Los divisores elementales de la matriz U tendrán, con arreglo 
a la construcción, los valores requeridos y el teorema queda 
demostrado. 


Ejemplos y problemas 


l. Constrúyase una matriz ortogonal de divisores elementales (A— 1), 
1 
OI, A=q yA=2 
2. Demuésirese que las matrices de tipo AA +8, donde A es una matriz 


simétrica regular y Æ es una matriz antisimétrica, contienen un número par de 
veces todo divisor elemental de tipo 1%”. 


3. Empleando el teorema 2, redúzcase a la forma elemental el siguiente 
par de formas cuadráticas 


REH RIH + Ms Lo 
EERE 2BI h 281a — ata + DE — Bake, 
Respuesta; 2 Gès +E 5) y Si+ Ht 
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4. Constráyase una matriz compleja antisimétrica de divisores elementales 
AD +3), At, 42 y A3, 

5. Constrúyase una matriz compleja simétrica de divisores elementales 
ada y de. 


$ 27. Espacios simpliciales 


27.1, Aplicaciones simétricas. Se llaman espacios simpliciales, 
. según el p. 24.2, los espacios bilineales métricos provistos de una 
métrica antisimétrica no degenerada. La dimensión de un espacio 
simplicial es un número par. Puesto que todos los espacios simpli- 
ciales de una dimensión dada son reciprocamente isomoríos, en todo 
espacio simplicial de dimensión n=2m existe una base, cuya mat- 
riz de Gram es igual a cualquier matriz antisimétrica regular de 
orden n dada de antemano. En particular, en todo espacio simpli- 
cial existen sistemas de coordenadas, en los cuales la matriz de 
Gram es de la forma 


[ordre lc 


Estos sistemas se llamarán simpliciales. Análogamente, en £ existen 
sistemas de coordenadas, en los cuales la matriz de Gram es de 


la forma 
0E 
1=[_2 of 


donde E es una matriz unidad y O es una matriz nula. Convencre- 
mos en llamar estos sistemas normales. Ea lo que sigue considera- 
remos solamente espacios simpliciales complejos. 

Sea ahora 4 una aplicación simétrica de £. Descompongamos Y 
en la suma directa 


L=%o Ho +. H Loy 


donde Pi, Pa, -.-, Ps son los diferentes valores propios de la apli- 
cación ul y Lp, ..., Lo, son los correspondientes subespacios ra 
cales. Los subespacios L,, son, según el p. 25.2, reciprocamente 


ortogonales. Debido a que el espacio 2 es no degenerado, los subes- 
pacios Lp,, ..., Lo, también son no degenerados ap Por consiguiente, 
simpliciales, Tomemos uno de ellos, digamos %,, e indiquémoslo 
por M. Sea 4, la aplicación inducida en M por la aplicación Z. 
Pongamos, además, 4,—p,6 =3. Puesto que 4, y $ son aplica: 
ciones simétricas, ® es también una aplicación simétrica. Todos 
los valores propios de la aplicación 4, son iguales a pj luego, 
indicando por p la dimensión del espacio M,obtenemos 


(AP 6)'=2R'=06. 
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Sea m el exponente menor para el cual 2%=G. La expresión 
(xB, y) es una función bilineal antisimétrica en x e y correspon- 
diente a la aplicación B"-*, Puesto que 27-1340, la función 
(xíB"=2, y) no puede ser igual idénticamente a cero y, por consi- 
guiente, en M existe un par de vectores a y b tal que (a $", b) = 1. 
Pongamos 
ABI=4j41 y OBI=b),, (i=0, 1, ..., m—I). 
Debido a la simetria de B, tenemos 
(ap a) = (aB, aB) = (aB, a) =(a, aB), 
Sin embargo, el espacio £ es antisimétrico y por esto 
(aB/*4=2, a) =—(a, ap/r*-2), 


Comparando esta fórmula con la anterior, vemos que 


(an a)=0 (j, k=1, 2, ..., m). (2) 
Análogamente se obtienen también las relaciones 
(bj, ba)=0 (i, k=1, 2, ..., m). (3) 


Además, de las condiciones (a2%"1, b)=1 y 3".=0 se deduce: 
(amos bisi) = (ABI, bB) =(aB 771, b)= (am, bi)=1 (4) 


(ap ba) =(0B/2, DB1) =(04B/Y=2, b)=0 (j+k>m+1). (5) 
Formando ahora la matriz de Gram de los vectores a, ..., Am, 
br... Om, veremos, en virtud de las relaciones de (2) a (5), que 
tiene la forma triangular con ceros sobre la segunda diagonal. 
Puesto que los elementos que se hallan en la propia segunda dia- 
gonal son iguales a+ 1, el determinante de esta matriz es diferente 
de cero. Por consiguiente, el subespacio Mi, tendido sobre los vecto- 
TOS dis «2», Oms Dis ..., Dm es no degenerado. Indiquernos por My 
y Mi, los subespacios tendidos sobre los vectores a, ..., as 

u» ==> Bn, respectivamente. Debido a las relaciones (5), los 
subespacios Mi, y M, son de una misma dimensión y M, es la 
suma directa de los mismos. Puesto que W, es no degenerado, 
tenemos, en virtud del punto 24.2, 


M=M,+M. 
El subespacio M, es invariante respecto a B y por esto Mt tam- 
bién es invariante respecto a B. Procediendo ahora con Mè igual 


que con M, podemos despejar en Më un subespacio M, que es 
una suma directa de dos subespacios M,, y M,,, etc. Después de 
un número finito de pasos obtendremos la descomposición directa 


M=M, +M, +... Mo, 


$ 27. Espacios simpliciales 311 


donde cada uno de los subespacios M,, ..., M, será, a su vez, 
una suma directa de dos subespacios de una misma dimensión. 
A todo subespacio de dimensión m que figura en esta descomposi- 
ción le corresponde un divisor elemental (.—p,)” de la aplicación .£. 
Por consiguiente, llegamos a la conclusión de que en un espacio 
simplicial los divisores elementales de las aplicaciones simétricas 
aparecen en pares (A—p/)”, (A—p/)”. 


A todo par (A—p), (A—p,)” ponemos en correspondencia el 


par de matrices 
al e] a=[8:5) 


donde E, es la matriz unidad de orden m; y B; es la célula de 
Jordan de orden m; con el valor propio p, y sea 


G=G,+...+6, y A=A,+...+ As. (6) 


Consideremos un espacio bilineal métrico complejo £ de matriz de 
Gram G. Puesto que G es una matriz antisimétrica regular, el 
espacio Ê es un espacio simplicial. Los cálculos directos muestran 
que a 

AG=A/0, + A,0,+...+4,0, 


es una matriz antisimétrica. Por esto la aplicación lineal 4 del 
espacio $, cuya matriz es A, es simétrica. Al mismo tiempo, los 
divisores elementales de la aplicación 4 tienen los valores requeri- 
dos. Es decir, hemos obtenido el teorema siguiente: 

TEOREMA 1, Todo divisor elemental de una aplicación simétrica 
de un espacio simplicial aparece un número par de veces. Reciproca- 
mente, todo sistema de expresiones de tipo (A—p)" que cumple esta 
condición es un sistema de divisores elementales de una aplicación 
simétrica de un espacio simplicial. 

Sabemos ya (p. 25.1) que las aplicaciones simétricas de los es- 
pacios simpliciales que tienen divisores elementales iguales son iso- 
morfas. Por ello, el teorema 1 resuelve plenamente el problema de 
clasificación de las aplicaciones simétricas. En particular, muestra 
que para toda aplicación simétrica 4 de un espacio simplicial € 
se puede escoger una base tal que la matriz de Gram G y la matriz A 
de la aplicación sean de la forma (6). 


27.2. Aplicaciones antisimétricas. Una aplicación lineal Z de 
un espacio bilineal métrico Y es antiSimétrica, si (x4, y) =— (x, y4) 
para todos los x e y deL. 
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En virtud del teorema 3 del p. 26.2, los divisores elementales 
de una aplicación antisimétrica .4 de un espacio simplicial , co- 
rrespondientes a los valores propios no nulos, aparecen en forma de 
pares de tipo (A—p)”, (A-+p)". Probemos que los divisores elemen- 
ales de la aplicación 4 correspondientes al valor propio nulo, es 
decir, los que son de forma A”, también aparecen en forma de 
pares, A", Am, si m es impar. La demostración es completamente 
análoga a la demostración de la afirmación respectiva del p. 26.2 
y sólo indicaremos el esquema de la misma. 

Nos basamos en la representación de £ en la forma de la suma 
directa de los subespacios radicales de la aplicación 4. Agrupando 
en esta representación los subespacios correspondientes a los valores 
propios opuestos, obtendremos la descomposición 


2=M+M,+4...4M, 


donde todos los subespacios M, ..., M, son invariantes y recipro- 
camente ortogonales, siendo M, el subespacio radical correspondiente 
a la raíz nula. Sea 4, la o del subespacio M, inducida 
en éste por la aplicación 4. Todos los valores propios de la apli- 
cación «lą son iguales a cero y, por ello, 43=6, donde p es la 
dimensión de M,. Indiquemos por m el menor exponente para el 
cual 7 ==6. La aplicación A, es antisimétrica y, por consiguiente, 
la aplicación .43=* será, igual que en el p. 26.2, simétrica para m 
impar y antisimétrica para mper Sin embargo, la correspondiente 
función bilineal (x(9=*, y) será ahora simétrica para m par y an- 
tisimétrica para m impar, ya que la métrica de los espacios simpli- 
ciales es antisimétrica. Los razonamientos ulteriores del p. 26,2 se 
conservan con la única diferencia que se obtendrá ahora un par de 
espacios en el caso de m impar. 

TEOREMA 2, Los divisores elementales de las aplicaciones antisimé- 
tricas de los espacios simpliciales correspondientes a los valores pro- 
pios no nulos aparecen en forma de pares (A—py”, (M+p)”; los 
divisores elementales de tipo »” con m impar también aparecen en 
forma de pares A”, A” y los divisores elementales 2” con m par 
pueden aparecer en combinaciones arbitrarias. Reciprocamente, todo 
sistema de expresiones de tipo (à—p;)™' que posee estas propiedades 
es un sistema de divisores elementales de una aplicación antisimétrica 
de un espacio simplicial. 

Es preciso demostrar sólo la segunda parte de este teorema. Con 
este fin, a todo par de expresiones de tipo (A—p¿)"1, (Ap), y 
en particular al par con p;=0, ponemos en correspondencia el par 


de matrices 
o-[2,5]»4=[6 2). 


donde E; es la matriz unidad de orden m; y B; es la célula de 


$ 27. Espacios simpliciales 313 


Jordan de orden m; y de valor propio p; A las expresiones que 
quedan de tipo X": con m; par ponemos en correspondencia el par 
le matrices 

Was 010... 00 
0 01...00 


0 
0 
¿Dil ge i 

L—10 o. 


6=G6,+... 46, y A=A,+...+As,. 


Consideremos un espacio bilineal métrico complejo L de matriz de 
Gram igual a G. La matriz G es a métrica y regular y por 
esto el espacio £ es simplicial. La aplicación lineal 4 de matriz A 
tiene los divisores elementales dados. Al mismo tiempo, la aplica- 
ción .4 es antisimétrica, ya que los cálculos directos muestran que 
la matriz 


AG=A,0,+A,0,+... 44,0, 
es simétrica. Hemos demostrado el teorema. 


27.3. Aplicaciones simpliciales. Las aplicaciones isométricas de 
un es simplicial Y suelen Tamarse aplicaciones simpliciales de 
este espacio. Por consiguiente, si U es una aplicación simplicial 
del espacio £, se tiene (xU, yU)=(x, y) para todos los x e y de L. 
En términos de matrices esta igualdad da 
(*] UGU’ (y) = [x] G [y]', 
de donde resulta 


UGU’ =G, (n 


donde G es la matriz de Gram y U es la matriz de la aplicación Y. 
Tomando en £ un sistema simplicial de coordenadas, convertiremos 
la relación (7) en 

USU'=S, (8) 


donde S es una matriz simplicial de tipo (1). Las matrices U que 
satisiacen la condición (8) serán llamadas matrices simpliciales. 
Por consiguiente, para que una aplicación lineal de un espacio 
simplicial sea simplicial es necesario y suficiente que su matriz 
sea simplicial en un sistema simplicial de coordenadas. De (8) 
también se desprende directamente que una suma directa de matri- 
ces simpliciales es una matriz simplicial. 

Sea Y una aplicación simplicial arbitraria de un espacio simpli- 
cial £. Representando £ en la forma de la suma directa de los 
subespacios radicales de la aplicación U y agrupando después los 
sumandos correspondientes a los valores propios reciprocamente 
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inversos de la aplicación Y, obtenemos la descomposición 

L=M EMN IM). Mo, 
donde M_, y Mi, son los subespacios radicales correspondientes 
a los valores propios —1 y +1. Los subespacios M_,, ..., M, 
son, en virtud del teorema 7 del p. 25.2, reciprocamente ortogonales. 

El estudio del comportamiento de U sobre L se reduce ahora 
al estudio del comportamiento de Y sobre cada uno de los subes- 
pacios M; por separado. Repitiendo los razonamientos del p. 26.3 
y empleando, en lugar del teorema sobre los divisores elementales . 
de las aplicaciones antisimétricas de los espacios euclídeos comple- 
je el respectivo teorema para los espacios simpliciales, obtenemos 
la siguiente proposición: 

TEOREMA 3. Los divisores elementales de las aplicaciones simplicia- 
les correspondientes a los valores propios diferentes de +1 aparecen 
en forma de pares (1—p)”, (A—p”*)"; los divisores elementales de 
tipo (à+ 1)9'9* también aparecen en forma de pares (A+ 1)P9*, 
(24 109900 (A ipat, (A—1)t9+2 y los divisores elementales de 
tipo (à+ 1)™ pueden aparecer un número arbitrario de veces. Reci- 
procamente, todo sistema de expresiones de tipo (»—pJ", p0, que 
posee estas propiedades es un sistema de divisores elementales devuna 
aplicación simplicial. 

Las aplicaciones simpliciales que tienen divisores elementales 
iguales son, en virtud del teorema 1 del p. 25.1, isomorías. Por 
esto el teorema 3 ofrece una clasificación completa, salvo un iso- 
morfismo, de las aplicaciones simpliciales. Este teorema muestra, 
en particular, que si —1 es un valor propio de una aplicación 
simplicial, la multiplicidad de este valor propio es necesariamente 
par. Como todos los demás valores propios o bien son iguales a +1 
o bien figuran en forma de pares recíprocamente inversos y de la 
misma multiplicidad, el producto de todos los valores propios de 
una aplicación simplicial es igual a +1". Este producto es igual 
al determinante de la matriz de la aplicación y llegamos así a la 
conclusión de que los determinantes de las matrices de las aplica- 
ciones simpliciales son iguales a la unidad. 


Ejemplos y problemas 


ds ¿Confttlyese una matriz' simplicial de divisores elementales 4+1, 441 
y à=. 


2. Demuéstrese que las matrices de tipo | = e , donde B y C son ma- 


trices cuadradas antisimétricas de un mismo orden, contienen todo divisor ele- 
mental un número par de veces. 

3. Enúnciese el teorema 1 como el teorema de pares de formas bilineales 
antisimétricas. 


1) Todo valor proplo se cuenta tantas veces como indique su multiplicidad. 
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$ 28. Espacios seudounitarios 


En el p. 24.2 hemos llamado espacios seudounitarios los espa- 
cios bilineales métricos hermitianos sobre el cuerpo de los números 
complejos provistos de una métrica no degenerada y simétrica: 
(x, y)=(y, x). También hemos demostrado en esa ocasión que todos 
estos espacios se determinan, salvo un isomorfismo, por su dimen- 
sión n y su signatura s y que, para un valor dado de n, s puede 
tomar los valores n, n—2, ..., —n. Al igual que antes, nos 
interesarán las propiedades de las aplicaciones simétricas, antisi- 
métricas e isométricas. La clasificación de estas aplicaciones en el 
caso de espacios euclídeos complejos y de espacios simpliciales se 
basa en el teorema 1 del p. 25.1. En los espacios seudounitarios 
este teorema no tiene, en general, lugar. Consideremos, por ejemplo, 
un espacio bilineal métrico hermitiano de dos dimensiones £ de 
base e,, y e, y de matriz de Gram lo e a 
Las aplicaciones lineales U, y U, definidas por las igualdades 


eU, =, e, =g e 
el Et eU, = 22, 


serán, obviamente, aplicaciones isométricas de este espacio. Los 
divisores elementales de las aplicaciones U, y U, son los mismos, 
a saber, 22 y 1—4. Sin embargo, U, y U, no son isomorfas, 
En efecto, si las aplicaciones U, y U, fuesen isomorfas, los subes- 
pacios radicales correspondientes al valor propio 2 podrían ser 
transformados uno en el otro mediante un automorfismo del espa- 
cio £. El subespacio radical correspondiente al valor propio 2 de 
la aplicación U%, es la recta ae, y el subespacio análogo de Ja 
aplicación U, es la recta ae, Al mismo tiempo, todos los vectores 
no nulos de la primera recta tienen un cuadrado positivo y todos 
los vectores no nulos de la segunda recta tienen un cuadrado nega- 
tivo. Por consiguiente, ningún automorfismo del espacio £ puede 
transformar la primera recta en la segunda que es lo que se quería 
demostrar. 

Este ejemplo muestra que la vía puramente geométrica para el 
estudio de las aplicaciones de los espacios seudounitarios resulta, 
en cierta medida, necesaria. 


28.1. Aplicaciones simétricas. Sea L un espacio seudounitario 


de dimensión n FA de signatura s. Consideremos un subespacio 
lineal arbitrario % de Q. Convendremos en decir que un sistema 
de coordenadas de N es normal positivo si su matriz de Gram es 
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de la forma 


y que es normal negativo si su matriz de Gram es de la forma 
po.. 0—1 


(2) 


Es obvio que no' todo subespacio admite un sistema normal de 
coordenadas. Esto. depende de la signatura del subespacio y de su 
dimensión. Los subespacios de dimensión par que admiten un 
sistema normal de coordenadas, positivo o negativo, son de signa- 
tura cero; los subespacios de dimensión impar con un sistema nor- 
mal positivo de coordenadas son de signatura -+1 y los que poseen 
un sistema normal negativo de coordenadas son de signatura — 1. 
La demostración se deduce fácilmente de la definición de la si- 
gnatura (p. 24.2). 

Estudiemos los divisores elementales de una aplicación simé- 
trica Æ de un espacio seudounitario £. Descompongamos Ẹ en la 
suma directa de los subespacios radicales de la aplicación 4 y agru- 
pemos los sumandos que corresponden a los valores propios con- 
jugados. Así obtendremos la descomposición de £ en la suma 
directa de subespacios invariantes 


L=M, 4M, +... +N. (3) 


Estos subespacios son, ún el p. 25.2, recíprocamente ortogonales 
y por ello el estudio de la aplicación 4 se reduce al estudio 
de la aplicación 4 en cada uno de los M; El espacio L es no 
degenerado y por esto todos los M; son también no degenerados. 
Observemos ahora que los subespacios M; pueden ser de dos tipos: 
1) M; es la suma directa de dos subespacios radicales correspon- 
dientes a valores propios conjugados no reales y 2) M; es el sub- 
espacio radical coeresponidiente a un valor propio real. Considere- 
mos el primer caso: sea 


MM +M, 


D Si æ es un valor propio y a no es un valor propio, aceptaremos formal- 
mente que R es el subespacio nulo. De los razonamientos ulteriores se deduce, 


sin embargo, que este caso no puede darse. 
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donde WM; y M; son los subespacios radicales correspondientes a los 
valores propios æ y a, donde œa. Razonando igual que en el 
p. 25.1, obtenemos 

(as, a)=0 y (a, a)=0, (4) 
donde aí y a; son vectores cualesquiera de WM; y aj y az son vec- 
tores cualesquiera de M5. Si existe un vector a? de M; ortogonal 
a todos los vectores de M}, el vector a” es isótropo en M. mo 
el subespacio M; es no degenerado, esto da a':=0. Luego, para 
todo vector no nulo del subespacio W; existe un vector no orto- 
gonal del subespacio My. 

Hemos supuesto que M; es el subespacio radical de la aplica- 
ción 4 correspondiente a la raíz a. Por consiguiente, tenemos para 
un valor natural de m 

Mi(4—af =o y MiA—uUb)""! o (5) 
Tomemos en M; un vector a tal que a(4—ab)”-"%0. Puesto 
que a(4—ag)"=" es diferente de cero, en M existe un vector b 
no ortogonal a a(4—a6)”"*. Normalicemos b de modo que 
(a(4—ab)""*, b)=1. 
Pongamos ahora 


a(t—a6 =a, y bA—86/=0/4, 
(j=0, 1, ..., m—I). 
Como la aplicación 4 es simétrica, resulta 
(A—a6=4—3E y (4—a8)" =(4—38)". 
Por consiguiente, para j+k=m+1 se tiene 
(A), dy) =(a(4—a8)/—*, b(4—38¥-) = 


=(a(4—ag)/'**, b)=1 (6) 
y para j+k>m+1 se tiene 
(a, by) =(a(4—a8)/1*==, b)=0, 1) 


En «particular, de (6) se deduce que b(4—26)""*:%0. Además, si 
a' pertenece a M, tenemos 


(a, b(A—236)”) =(a' (4A—a6)”, b)=0. 
En otras palabras el vector b(4—38)" del subespacio MI es orto- 
gonal a todos los vectores de M;. En virtud de la observación 
hecha, esto da b(4—a6)"=0. Indiquemos por N, y N; los subes- 


pacios tendidos sobre los vectores 2, y, -.., âma Y by bp + 


++ Boy 
respectivamente, 
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=a +00, +... + Anda 
cu=c (406) (i=l,.... m— l). 
De las fórmulas (6) y (7) se deduce que para cualesquiera valores 


de ap, ..., Œm se tiene (c,(4—a6)”-1, b,)=1, de donde obtene- 
mos de nuevo 


(Cp basi-p=l y fer dy) =0 6 
(U+k>m+1; k=l, ..., m). 
Es fácil ver que los coeficientes œp, ..., da se pueden escoger de 
manera que se cumplar las condiciones complenentarias 
(Cp bami t Bam) ==». = (Cr 01)=0. 
Entonces para ¡+k<m-+1 tendremos 
(Ej ba) =(0 by (A—8B)/** = (Cr, bjr) =0. 9) 
Sea N, =N; +N. Las relaciones (4) (8) y (9) muestran que el 
sistema C ..., Cmr Di -.., On es “un sistema normal positivo de 


coordenadas en N,. Al mismo tiempo, la matriz de la aplicación 4 
en este sistema de coordenadas se descompone en un par de células 
de Jordan de divisores elementales e y A—a)”. 

El subespacio N, es no degenerado; por El 


=N, NE, 


donde Nt es de nuevo un subespacio invariante respecto: a 4. Si 
MÍ 0, podemos, aplicando a Ni el proceso expuesto, despejar en 
él un subespacio invariante N,, etc. Así obtendremos para W; una 
representación de la forma 


M= ARH. bo, 


donde N,, ..., Ny son sybespacios invariantes recíprocamente orto- 
gonales y en cada uno de ellos existe un sistema normal positivo 
de coordenadas en el que la matriz de la aplicación .4 se descom- 
pone en dos células de Jordan de divisores elementales (A—a)” y 
(—a)”. 

Consideremos el segundo caso. Sea M; el subespacio radical co- 
rrespondiente a un valor propio real a. Buscamos de nuevo un número 
natural m tal que 


M,(4A—26)"=0 y M(A—A8)?712%0. 


Puesto que (A—a$)'=4—38=4—a6, la aplicación 4—ab 
, con ella, también la aplicación (4—«a6)""* son simétricas. 
a correspondiente función bilineal hermitiana (x(4—ag)}"-', y) 

es también simétrica y no se anula idénticamente sobre M,. Por 
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esto en M, existe un vector a tal que 
(a(4—a6Y=1, a) =P 40. (10) 
De la simetría de la función se deduce que f es real. Tomando 
a,=V IB" a, obtendremos en lugar de (10) la relación 
(a, (4—ag)"-', a)=e, e=kl. (11) 
En esta relación el signo de la unidad depende de las propiedades 


de la misma aplicación 4 y, en todo caso, no lo podemos cambiar 
mediante la normalización. Pongamos 


Aj41=0 (A—08) (j=l, ..., m—1). 
De (11) resulta: 

(Ay Gs) =(0, (A—a8)”"*, 01) e. (12) 
Análogamente, de la condición M, (4 —a6)” =0 obtenemos 
r (an a) = (a, (4—agy t-t, a)=0 (+k>me+l) (13) 
ü b,=0,4+0%0)+-.. + Anam, 
donde (y, « «+, Œm Son, por ahora, unos números arbitrarios. Pongamos 

dj =b/(A—06) (j=1,..., m—1). (14) 
De las igualdades (12) y (13) resulta: 

(bj basi- )=e y (bp b)=0 
U+k>m+l; ji k=l, ..., m). 


Es fácil ver que los números a, ..., 0, se pueden escoger de modo 
que se cumplan las relaciones 
(bis ba~) = (brs bas) = 
Entonces para ¡+k<m-+1 tendremos 
Op 0) = (bi, b, (A— 06/11 = (b, bja (16) 
Consideremos el subespacio M, tendido sobre b,, ..., ba. De (14) 
se deduce que N, es invariante respecto a 4 y que la matriz de 
la aplicación 4 en este sistema de coordenadas es igual a una célula 
de Jordan de divisor elemental (A—a)”. Por otra parte, de (15) 
y (16) se ve que b, ..., bẹ es un sistema normal de coordenadas 
en N, $ además, positivo, si e= 4+1, y negativo, si e=— 1. El 
espacio W, es no degenerado y, por ello, siendo N, 40, se tiene 
MN, 49M, 
donde Nt es un subespacio invariante de menor dimensión. Apli- 
cando a Ny el mismo proceso, despejaremos de MË un subespacio 


(15) 


= (b, 6,)=0. 
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invariante N,, etc., hasta obtener la descomposición de M, en una 
suma directa de espacios recíprocamente ortogonales. 

Aplicando ahora nuestros resultados a cada uno de los subespacios 
|, representaremos el espacio £ en la forma 


2=B,+B,+.-+Bo (17) 
donde P,, ..., B; son subespacios reciprocamente ortogonales, cada 
uno de los cuales corresponde o bien a un divisor elemental real 
(M—a)" de la aplicación «£ o bien es la suma directa de dos 
subespacios correspondientes a divisores elementales conjugados 
(A—a)" y (A—2)"; además, en los subespacios del primer tipo 
existen sistemas normales, positivos o negativos, de coordenadas en 
los que la matriz de la aplicación 4 será una célula de Jordan, 
mientras que en los subespacios del segundo tipo existen sistemas 
normales positivos de coordenadas en los que la matriz de la aplicación 
ul será la suma directa de dos células conjugadas de Jordan. 

A todo subespacio PB), correspondiente a una raíz real q, le 
corresponde un divisor elemental (A—a)”" de la aplicación 4. Con- 
vengamos en poner en ey al subespacio $; el divisor 

1 


elemental + (A—a)”, si en existe un sistema normal positivo 
de coordenadas, en el que la matriz de la aplicación 4 tiene la 
forma de una célula de Jordan, y el divisor elemental — (A—a)”, 
si en $; existe un sistema normal negativo de coordenadas con la 
ropiedad señalada. Mediante esta regla podemos, basándonos en 
la descomposición (17), obtener un sistema de divisores elementales 
de la aplicación 4 en el que todo divisor elemental real tendrá un 
signo determinado. Un sistema de divisores elementales de este tipo 
convendremos en denominarlo de signo definido. Repitiendo los 
razonamientos, realizados al final del p. 26.1, obtenemos que son 
isomorfas las aplicaciones simétricas del espacio £ que tienen unos 
sistemas de divisores elementales de signo definido iguales. 

Supongamos ahora que tenemos dado un sistema arbitrario de 
expresiones de tipo + (A—a¿)":, en el que todas las expresiones 
no reales aparecen en forma de pares conjugados y llevan el signo 
«más». ¿Existen un espacio seudounitario Y y una aplicación simé- 
trica Æ del mismo tales que el sistema dado +(A—a¿Yu sea un 
sistema de divisores elementales de signo definido de la aplicación 4? 
La respuesta es, obviamente, afirmativa. La construcción del es- 
pacio £ y de la aplicación Z se puede realizar siguiendo el mismo 
método que ha sido empleado en el p. 26.1. Puesto que para esta 
peaucción no se necesita nada nuevo, la dejamos a cargo del 
lector. 

Queda por demostrar un resultado más sútil de que el sistema 
de divisores elementales de signo definido de una aplicación 4 no 
depende de cómo se escoja la descomposición (17) y se determina 
totalmente por la propia aplicación. 
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La descomposición (17) ha sido obtenida como resultado de la 
división de Jos subespacios M,, ..., M, en subespacios cíclicos P. 
Puesto que los propios subespacios WM, Son o bien radicales o bien 
una suma de subespacios radicales, y, por consiguiente, se deter- 
minan univocamente, la no unicidad puede surgir solamente al 
descomponer cada uno de los subespacios My. Los subespacios WM, 
que son unas sumas de dos subespacios radicales no tienen interés 
para nosotros, ya que al descomponerlos se obtienen pares de subes- 
pacios cíclicos con pares de divisores elementales conjugados de tipo 
(M—a)” y (—3)”. Luego, resta demostrar solamente que como 
quiera que se descomponga un subespacio radical M, con raíz real a 
en una suma de subespacios no descomponibles y recíprocamente 
ortogonales, el sistema de divisores elementales de signo definido 
+ (À—a)” será el mismo. 


Sean 

M =N HNR +... +No (18) 

MARE HB (19) 
dos descomposiciones de WM, en sumas ortogonales de subespacios no 
descomponibles. Indiquemos por ô; (ì—a)"™ y e, (+—a)™ los divisores 
elementales de signo definido correspondientes a los subespacios N; 
y Va, respectivamente (i=1, ..., f; 6, e;==+1). Coloquemos los 
sumandos de las sumas (18) y (19) de modo quem, > m, >... > My 
Supongamos que tenemos varios sumandos de dimensión mayor: 


m, =My > Mps, Demostremos entonces que los sistemas de 
divi: elementales mayores e,(A—a)m, ..., e—a y 
B,(A—a)m, ..., Ôa (A—a)" están compuestos de los mismos tér- 


minos. Consideremos la función bilineal f, (x, y) = (x (4 —28)*"*, y). 
La aplicación 4—«6 es simétrica y por esto la función f, (x, y) 
es también simétrica, Determinemos su signatura empleando la des- 
composición (18) y empleando la descomposición (19). Todos los 
subespacios de la descomposición (18) son ortogonales respecto a la 
función f(x, y). Por ello la signatura de la función f, (x, y) sobre M, 
es igual a la suma de sus signaturas calculadas por separado sobre 
cada uno de los sumandos. Sin embargo, para p > k tenemos 


N, (A—a6)""1=0 - 

y, Por consiguiente, f, (x, y) se anula sobre Sp. Consideremos ahora 
os subespacios N,, ly. Sea a, An una base de N, tal que 
au =a (428) (=l, a, ml) 

Puesto que a, (4—ag)™ =0, se tiene para J+k>2 
h (an a) =(9,(4—a8)""*, a) =0. . 


Por otra parte, según la definición del signo de un divisor ele- 
mental, tenemos 


fi(n, a, 


(a (4 ag)", a) = ô, 
211843 
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Por consiguiente, la matriz de la función f, (x, y) en la base a,, ..., am 
contendrá sólo un e'emento no nulo que será igual a ô, y se ha: 
lará al principio de la diagonal principal. De aquí se ve que la 
signatura de la función f, (x, y) sobre N, también será igual a ô, 
Razonamientos análogos se pueden realizar también en el caso de 
los subespacios N,, ..., Ny. Así obtenemos que la signatura de la 
función f, (x, y) sobre M, es igual a 6,+8,+... +8. Tomando 
en vez de la descomposición (18) la descomposición (19), llegaremos 
a la conclusión de que la signatura de la función f, (x, y) sobre My 
es igual a e,+e,+... +e. Por consiguiente, se tiene 


O hó +... Hie HeH hey (20) 
Puesto que ô;, e,==+ 1, de (20) resulta que los sistemas de núme- 
ros 6,,..., Ôn y €,, ..., €, pueden diferir sólo en el orden de se- 


cuencia de los números y que, por consi 

divisores elementales mayores 5, (A—a)”, 

— a)", ..., e, (A—a)" coinciden. 
msideremos ahora la función bilineal 


hia, = (tagt, y). 


Esta función se anula sobre todos los os de dimensión 
menor que mp.,,. Por ello, para la signatura de f,(x, y) sobre My 
tenemos las expresiones siguientes: 


sign, M= sign. N, +... + sign. Ny- sign. Ny, +... Psign. N, "y 21) 
sign, M,=sign. P, +--+ sign. Pa+sign. Par +... Hsign. By, f C 

donde aceptamos que my. =... =M, > Mp4, Puesto que hemos 
demostrado ya que las signaturas de la función f, sobre los subes- 


pacios correspondientes de mayor dimensión coinciden, de (21) re- 
sulta que 


sign. Nyai +... +sign. N = sign. Bas + - sign. Bp, 
es decir, 


iente, ambos sistemas de 
2, O A— a)n y e, (A — 


Srst- H= er ho H Ep (22) 


De (22) se ve que los divisores elementales de potencia mp., de la 
aplicación 4 también coinciden. Continuando este proceso, obtene- 
mos que los sistemas de divisores elementales de signo definido de 
la aplicación .4, calculados mediante las descomposiciones (18) y 
(19), coinciden. 

Veamos ahora qué puede decirse sobre la signatura del espacio 
principal £, si se conoce un sistema de divisores elementales de 
signo definido de una aplicación simétrica Æ de este espacio. La 
descomposición (17) muestra que la signatura del espacio £ es igual 
a la suma de las signaturas de los subespacios Mr =., Pp. En 
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aquellos subespacios $, que corresponden a pares conjugados de va- 
lores propios existe un sistema normal positivo de coordenadas. Sin 
embargo la dimensión de éstos es par y, por consiguiente, la sig- 
natura es igual a cero. 

También es igual a cero la signatura de los subespacios que 
corresponden a divisores elementales reales de potencia par. Por ello 
quedan sólo los subespacios que corresponden a los divisores ele- 
mentales reales de potencia impar. La signatura de éstos es igual 
at], según sea positivo o negativo el correspondiente divisor ele- 
mental. Por consiguiente, 

$=5,—S» (23) 
donde s es la signatura del espacio £, s, es el número de divisores 
elementales positivos y s, el número de divisores elementales nega- 
tivos reales de potencia impar de la aplicación 4. 

De las fórmulas (23) se desprende, en particular, que toda apli- 
cación simétrica de un espacio seudounitario de signatura s tiene por 
lo menos |s| divisores elementales reales de potencia impar. 

El estudio de las aplicaciones antisimétricas de los espacios seu- 
dounitarios se reduce directamente al estudio de las aplicaciones 
simétricas, ya que siendo 4 una aplicación simétrica, la aplicación ¿4 
será antisimétrica y viceversa. 


28.2. Aplicaciones seudounitarias. Las aplicaciones isométricas 
de los espacios seudounitarios se llaman aplicaciones seudounitarias. 
Sea Y una aplicación seudounitaria de un espacio Y. Representando & 
en la forma de la suma directa de los subespacios radicales de la apli- 
cación U y agrupando los sumandos correspondientes a las raíces œ 


y B, que cumplen la relación a=1, obtenemos una nueva des- 
composición de £: 


LM EM, 4M, H.. EMs, 


donde los subespacios WM, son invariantes respecto a Y y son, en 
virtud del teorema 3 del p. 25.1, reciprocamente ortogonales. A cada 
uno de estos subespacios se puede aplicar una de las fórmulas de 


Cayley (p. 25.2): 
ra A= (EU) (64 (24) 


A =i l HUW (EUA, (25) 


Como resultado obtenemos unas aplicaciones simétricas de los sub- 
espacios M,. De (24) y (25) tenemos 


U= (EH iANE—IiA)" 


o 


y, respectivamente 
U= (Ei NE it 
a+ 
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En el primer caso todo divisor elemental de la aplicación £ de 
tipo (A—a)” se transforma en el divisor elemental (A—y)”, donde 
y=(1-+ a) (1—ia)”*, y en el segundo caso en el divisor elemental 
(A— y)", donde y=— (1 +10) (1—ia)"2. Puesto que 4 es una apli- 
cación simétrica, sus divisores elementales no reales de tipo (A—a)” 
aparecen en forma de pares (A—a)”, (A—«a)”. Sin embargo, 
(14:10) (1 —i0)*=(1=10)(1Fi0)7 y, por ello, los correspon- 
dientes divisores elementales de la aplicación U% también aparecerán 
en forma de pares, pero éstos serán ya de tipo (A—y)”, (—P"")%. 
En cambio, si a es real, para y=(1-+10)(1—1a)-" obtenemos la 
relación yy=1. Reciprocamente, de yy=1 se desprende que œ es 
real. Por consiguiente, las fórmulas (24) y (25) establecen una co- 
rrespondencia entre los divisores elementales de una aplicación seu- 
dounitaria Y y los divisores elementales de una aplicación simétrica 4. 
Hemos visto que las aplicaciones simétricas se determinan, salvo 
un isomorfismo, por sus sistemas de divisores elementales de si; 
definido. Por esto las aplicaciones seudounitarias se determinan, salvo 
un isomorfismo, por sus sistemas de divisores elementales de signo 
definido. Pero en estos sistemas los signos «más» y «menos» deben 
ser colocados ahora ante los divisores elementales que corresponden 
a los valores propios de módulo igual a la unidad. 


Ejemplos y problemas 
1. Realícese la demostración completa de todas las afirmaciones de los p. p. 28.2 


2. Sen £ un espacio seudounitario de cuatro dimensiones de signatura 2 (es- 
paclo complejo de Lorentz). Tomemos como sistema principal de coordenadas 
de £ el sistema ej, €, es y e, en el que el cuadrado escalar de un vector x == 
=Ert1 H Esto + Esta + Ese, es de la forma (x, )=El+Ei+EÍ—El. Demuéstrese 
que la matriz de toda. aplicación simétrica del espacio E puede ser reducida, en 
un adecuado sistema principal de coordenadas, a una de las formas siguientes: 


Cd > Cea 


donde a, B. y y ð son números reales. Resuélvase el problema análogo para 
las matrices de las aplicaciones seudounitarias del espacio £. 
3. Si a es la dimensión de un espacio y s es la signatura de una función 


bilineal hermitiana f, se llama caracteristica de Fla expresión x= TË]. pe. 


muéstrese que la característica de un espacio seudounitario £, en el que actúa 
una aplicación simétrica 4, satisface la desigualdad 


k 
124 Y Bl A 
donde A es igual a la mitad de la suma de tos exponentes de los divisores ele- 
mentales complejos de la aplicación 4 y k recorre todos los valores de los ex- 
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ponentes de sus divisores elementales reales. El símbolo [3] representa el ma- 


yor número entero que no pasa de $. 
4. Sea, en las condiciones del problema anterior, f(x, Y) =(xA, y). Demués- 
irese que la característica de la función f cumple la desigualdad 


suziri]. 


donde A es la mitad de la suma de los exponentes de los divisores elementales 
complejos de la aplicación €, A” recorre todos los valores de los exponentes de 
los divisores elementales correspondientes a les raíces reales no nulas y £* recorre 
lodos los valores de los exponentes de los divisores elementales correspondien» 
tes al valor propio nulo. 


A A A 
Capítulo VIH Espacios afines 


El concepto del espacio vectorial real de tres dimensiones surge 
de un modo natural al describir las propiedades principales del es- 
pacio físico corriente, siempre que en este espacio se haya destacado 
un punto como el origen de coordenadas. Puesto que ningún punto 
del espacio físico tiene ventaja alguna ante los demás, conviene 
tener, además del concepto de espacio vectorial, un modelo mate- 
mático que corresponda al concepto del espacio en el que no se 
hayan fijado de antemano puntos algunos. Ejemplos de estos mo- 
delos son el espacio afín y el espacio euclídeo puntual. En este 
capítulo serán expuestos los elementos de la teoría de estos espacios. 
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29.1. Axiomática, Sea dado un espacio vectorial £ sobre un 
cuerpo conmutalivo K. Se llama espacio afín A sobre el espacio 
vectorial & un conjunto arbitrario tal que a todo par de elementos 
X e Y del mismo le corresponde un vector de £, indicado en lo 
sucesivo por XY, con la condición de que se cumplen las exigen- 
cias siguientes: 

Ay: para todo X EAÑ y todo vE2 existe un elemento Y €, y sólo 
uno, que satisface la relación KY =v; 

__A,; para cualesquiera X, Y y Z de A es válida la igualdad 
XY+YZ=XZ. 

Los elementos de un espacio afín se llaman puntos del mismo 
y los vectores de £ se llaman vectores libres del espacio A. 

Para cualesquiera XEMA y vel indicaremos por X-v aquel 
punto Y €A para el cual XY =v. Según el axioma A, un punto 
asi de Al existe y es único. De aquí, en particular, se desprende 
que para cualesquiera X, YEA y ugl se tiene 


X-XY=Y y X Ku)j=u. (1 
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En virtud del axioma A, tenemos XX +XY=X7 y, por ello, 
XX=0 y X-:0=X (XENA y 0€2). 
En vista del mismo axioma se tiene XY +VYX=XX y, por ello, 


XY=-—YX. (2) 
Finalmente, para cualesquiera X, O, B, C, DEA se tiene 
(X -0B)-CD = X -(0B+TD). (8) 
Pi efecto, sea X-OB=Y e Y-CD=Z. Debido a A, y a (l), se 
o 0B=XY, TD=YZ y 0B+TD=XZ 
y por esto 


(X-0B)TD=Z=X-XZ=X-(0B-+UD). 


Pongamos en correspondencia a todo par (O, B) de puntos del 


espacio Y la aplicación de A en A, indicada por OB y definida 
mediante la fórmula 


Ob: X— XUB (XEN, u) 


es decir, tomemos X-0B=X-DB. Las aplicaciones DB (O, BE) 
se llaman traslaciones (o también desplazamientos o traslados) del 
espacio A. La superposición de unas traslaciones OB y CD suele 
llamarse suma de estas traslaciones, es decir, se toma por definición 
que 


X-(0B+CD)=(X-0B)-CD=X-(0B+CD). (5) 


El producto de un elemento A€K por una traslación OB se de- 
fine mediante la fórmula 


X- QB) = X -(NOB). (6) 


El conjunto de todas las traslaciones del espacio A, provisto de 
las operaciones de adición y de multiplicación por todos los A€ K, 
se indicará por L(%). Las igualdades (5) y (6) muestran que la 
aplicación OX —»OX es un isomorfismo de '2 sobre L(%) y por 
esto L (X) es un espacio vectorial sobre K. 

Fijemos ahora en % un punto cualquiera O. Entonces la apli- 
cación X—ÓX (XEM) establece una correspondencia biyectiva 
entre los puntos de A y los vectores de £. El vector OX_ suele 
llamarse radio vector del punto X respecto al punto inicial O. El 


radio vector del punto desplazado X-BC se expresa en términos 
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Gel ridip; vector del punto dado inicialmente X mediante la fór- 
mula 


0(X-BC)=0X + (OC —OB). (7) 


Efectivamente, tomando X.8C=Y, óbtenemos XY =C y, por 
consiguiente, 


0(x-BC)=0Y =0X + XÝ =0X + BC. 


Supongamos ahora dado un espacio vectorial £ sobre un cuerpo 
conmutativo K. Llamemos puntos a los vectores de £ y pongamos 
en correspondencia a todo par (u, v) de ellos el vector 4v=0—u. 
Está claro que en este caso las exigencias A, y A, se cumplirán 
sin duda alguna y de esta forma el propio espacio vectorial £ se 
convertirá en un espacio afín sobre sí mismo. Indicaremos este 
espacio afín por A(2). Puesto que la igualdad Zy=u equivale a 
la relación y—x=u, obtenemos para las traslaciones del espacio 
A(2) la fórmula 


xbox + (cb). (8) 


Desde el punto de vista puramente algebraico, es conveniente a 
veces considerar, además del concepto de un espacio afín sobre un 
espacio vectorial, el concepto de un espacio afin sobre un cuerpo 
conmutativo que surge del modo siguiente. 

Indiquemos por A el conjunto de todos los puntos de un espa- 
cio afín A sobre un espacio vectorial L sobre un cuerpo conmuta- 
tivo principal K, Introducimos en A unas operaciones nuevas 
S(X, Y, Z) y P,(X, Y) tomando por definición 


S(X, Y,Z)=2Z-XY y P(X, Y)=X-(AKV) (9) 
y convertiendo con ello % en un álgebra nueva 
Me =(A; S, (PA) AEK). 


Es fácil comprobar que en el álgebra 9l* las operaciones $ y P) 
poseen las propiedades siguientes: 
Aj: Para cualesquiera O, B, C, X EW se tiene 


S(B, C, S(O, B, X))=S(0, C, X); (10) 
Aj: Para cualesquiera O, B, XEU* y AEK se tiene 
S(O, B, P, (0, X))>=P,(B, S(O, B, X); an 


Aj: Fijamos en Y* un punto cualquiera O y mediante las opera- 
ciones S y P, introducimos para los elementos de A* unas operaciones 
nuevas 


X+oY=S(0, X, Y) y à-oX =P, (0, X), (12) 
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llamadas adición local y multiplicación local de los elementos de U* 
por los números à (en el punto O). Respecto a estas operaciones lo- 
cales +o y A-o los elementos de U* forman un espacio vectorial 
sobre K que se indica en lo sucesivo por Lo. 

En electo, hemos visto que la aplicación X—OX (X €A) es 
una correspondencia biyectiva entre los puntos de A y los vecto- 
res de Q. Pasemos, de acuerdo con esta correspondencia, las opera- 
ciones vectoriales de Y a A, es decir, tomemos por definición 


X+Y=Z+>0X+0Y=0Z y M=2Zé»w0X=0Z. (13) 


Entonces A se convierte en un espacio lineal sobre K y el punto 
O será el elemento nulo de este espacio. Puesto que 


XAMAB=Y &> XY =24B<=>0Y—OX =1+(08—0A), 
y puesto que de (13) se deduce que 
OY —0X =»MOB—0A) => Y —X =%(B—A), 
tenemos pls 
XAAB=Y EY =X+2(B—4), 
de donde 
XAAB=X-+2(B—A) (14) 
y, por consiguiente, 
S(X, Y, Z=Y+4+Z—X, 
PAX, Y) =AY—X)4X, 
X+oY=X+Y y hoX=1X. 


Después de esto las afirmaciones Aj, A; y A; se hacen evidentes. 

Se llama espacio afin sobre un cuerpo conmutativo K un conjunto 
de elementos A provisto de una operación ternaria S(X, Y, Z) y una 
serie de operaciones binarias P,(X, Y) (€ K) que cumplen sobre A 
las exigencias Aj, Az y Aj. 

Un espacio afín sobre un cuerpo conmutativo K, al igual que un espacio 
vectorial sobre un cuerpo conmutativo K, es un álgebra (cuya signatura depen- 
de de K y es, en el caso general, infinita). Por esto para los espacios afines 
sobre un Cuerpo conmulativo resultan definidos automáticamente una serie de 
conceptos como isomorfismo, endomorfismo, congruencia, etc. 


Hemos visto como todo espacio afin A sobre un espacio vec- 
torial £ sobre un cuerpo conmutativo K puede ser convertido en 
un espacio afín U* sobre el cuerpo conmutativo K. Queremos de- 
mostrar ahora que de esta forma se puede obtener cualquier espa- 
cio afín sobre K. 

Sea, pues, Y=(4, S, P,) un espacio afin sobre un cuerpo con- 
mutativo K. Representando la identidad (10) en la forma 


C +a (B +o X)=C+o X as) 
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y tomando B=0, obtenemos 


CHo(0+X)=C+0X. 
Esta es una ecuación en el espacio vectorial o y, por ello, 
O+oX=X, (16) 


es decir, el punto O es el cero del espacio Lo. 
Para cualesquiera puntos fijos O y B la aplicación 


X—S(0, B, X) (XEB) 
del espacio B en si mismo se llamará traslación de B y se indi- 
cará por OB. Por consiguiente, tomamos por definición 
X:0B=8(0, B, X)=X+0B. (17) 
Representando la relación (16) en la forma X.00=X, vemos 
que la traslación ÖÖ es la aplicación idéntica de Y sobre sí mismo 
y que, en particular, 00 =XX para cualesquiera O, XEB. 


Al igual que antes, llamamos suma 0B+CD de trastaciones la 
superposición de las mismas, es decir, tomamos 


X-(0B+CD)=(X-0B)-CD=S(C, D, S(0, B, X). (18) 


La identidad (10) significa que para las traslaciones es válida 
la regla del triángulo 


0B+BC=00, (19) 


de la cual se desprende, en particular, que OB-+B0=00, es de- 


cir, que las traslaciones OB y BÒ son aplicaciones reciprocamente 
inversas. 


De (15) y (17) obtenemos 
X-CD=X+eD=X +o(C+s(D—AaC)=X +(D— r0), 
es decir, 
CD=B(D-,C). (20) 
Combinando las fórmulas (20) y (19), llegamos a la relación 
05+CD=0B+B/0—,0)=00-,0 


que muestra que la suma de traslaciones es una traslación, 


$ 29. Espacios afines generales 331 


Definamos, finalmente, la operación de multiplicación de los 
números 2€ K por una traslación OB, poniendo 


»-0B=0(%08)=0P,(0, B), 
es decir, aceptando que 


X-(0B)=5S(0, P,(0, B), X)=P,(X, X-B). (21) 


De la fórmula (21) se ve que siendo OB=CD, se tiene A-OB= 


=»:CD, es decir, la operación de multiplicación de un número por 
una traslación está definida univocamente. 

TEOREMA i. El conjunto L(X*) de todas las traslacipnes de un 
espacio afín A* sobre un cuerpo conmutativo K es un espacio vecto- 
rial sobre K respecto a las operaciones de adición de traslaciones y 
de multiplicación de un número por una traslación. El espacio LW) 
es isomorfo a cualquier de los subespacios Qo. Poniendo en corres- 
pondencia a todo par de puntos X, Y de Y la traslación XY € Lo 
convertimos Y* en un espacio afín A sobre el espacio vectorial L(N*). 
Si en el espacio A se introducen mediante las Fórmulas (9) las ope- 
raciones $ y P,, se obtiene de nuevo el espacio A”. 

Las dos últimas afirmaciones son evidentes, ya que, por ejem- 
plo, las fórmulas O, aplicadas al espacio A, se convierten simple- 
mente en las fórmulas (17) y (21). Demostremos las dos primeras 
afirmaciones, 


Tomemos un punto cualquiera O€A* y consideremos la apli- 
cación 


A:X— OX (XE2o). 
Puesto que cualquier traslación puede ser representada en la 


forma OX, resulta que A es una aplicación de £o sobre L(A*). 
Veamos si esta aplicación A conserva las operaciones de adición y 
de multipticación por números. Tenemos 


Z-O(X+0Y)=Z+0(X + oY)=(Z+0X)+0Y =Z-(0X 4-07), 


am e 
es decir, O (X +oY)=0X +0Y y, por consiguiente, 
(X+oY)A=XA+YA. 


Análogamente, de (21) obtenemos (À- o X) A =A-XA. Por consi- 
guiente, la aplicación A es un isomorfismo de L, sobre L(%*) res- 
pecto a las operaciones de adición y de multiplicación por núme- 
ros y, por ello, L(Y“), así como £, es un espacio vectorial sobre K. 

Planteemos, finalmente, ta pregunta: ¿bajo qué condiciones 
serán isomoríos dos espacios afines? 
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El concepto de isomorfismo suele introducirse para las álgebras arbitrarias 
son una misma signatura, Los espacios afines sobre un cuerpo conmutativo K 
han sido definidos como álgebras cuya signatura depende del cuerpo conmuta- 
tivo K. Por ello para los espacios afines sobre un mismo cuerpo conmutativo 
está definido también el concepto de isomorfismo. En cuanto a los espacios 
afines sobre un espacio vectorial dado, éstos no han sido definidos como unas 
áigebras de signatura fija, sino como unos sistemas de una estructura más 
compleja para los cuales no hemos introducido por ahora el concepto de iso- 
morfismo. 


Introduzcamos la definición siguiente. 

Se llama homomorfismo de un espacio afín A, definido sobre un 
espacio vectorial £, en un espacio afín B, definido sobre el mismo 
espacio vectorial £; toda aplicación puntual q: A— $ para la cual 


XI =XVY7 (X, YEN). (22) 
Está claro que dicha condición equivale a la siguiente: 
(X.o)p=Xvw (XEA y vel). 


Se ve de (22) que la aplicación ọ transforma distintos puntos 
en distintos y que siendo q un homomorfismo de Y sobre Y, la 
aplicación inversa q”* es un homomorfismo de B sobre A. 

Un homomorfismo de Y sobre Y se llama isomorfismo si la 
aplicación inversa es un homomorfismo de Y sobre A. Luego, para 
los espacios afines sobre un espacio vectorial fijo los conceptos de 
homomorfismo y de isomorfismo son equivalentes. 

Un isomorfismo de un espacio afín A, definido sobre un espacio 
vectorial £, sobre si mismo se llama automorfismo de A sobre Y. 

TEOREMA 2. Todos los espacios afines sobre un mismo espacio vec- 
torial son isomorfos. Los automorfismos de un espacio afín sobre un 
espacio vectorial son las traslaciones del mismo. 

Sean U y V unos espacios afines sobre un espacio vectorial €, 
Tomemos unos puntos arbitrarios AEA y BEB y consideremos la 
aplicación p: Av— Bo (vE 2). De los axiomas Ag A, deducimos 
directamente que q es un isomorfismo de A sobre Ù. 

Además, si q es un automorfismo del espacio afin A sobre el 
espacio vectorial £, obtenemos de la fórmula (22) que AX =X+X>, 
de donde X?= A+- AX y por ello 


X?=X.XA*- AXR =X- (AX + XA) = X. AA, 


es decir, q es la traslación de 9 determinada por el vector AAF. 
Recíprocamente, si q es una traslación, se tiene que q es de la 
forma X+= X-.0, donde v es un vector arbitrario fijo de £, y por 


lo tanto _ 
XY -XAV )=X. 


Un espacio afín sobre un cuerpo conmutativo K es un álgebra de signatura 
S, Pi AEK) 
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Un isomorfismo p de un espacio afín A, definido sobre un 
cuerpo conmutativo K, sobre un espacio afín B, definido sobre el 
mismo cuerpo K, es una aplicación biyectiva de Y sobre B que 
satisface las condiciones 

S(X, Y, Z)=S(Xr, Yr, Zr), 
PuX, Y? =P, (X°, Y») 


o, que es equivalente, las condiciones 


(2-X Y) =2Z+.XY>, (23) 
(XAXV )r=X>-AX7Y 7. (24) 


TEOREMA 3. Para que una aplicación q: AB de un espacio 
afin MU, definido sobre un cuerpo conmutativo K, sobre un espacio 
afín B, definido sobre el mismo cuerpo, sea un isomorfismo, es nece- 
sario y suficiente que la aplicación y: XY — XY? (X, Y EA) sea 
un isomorfismo del espacio vectorial L (A) sobreel espacio vectorial L (B). 

NECESIDAD. Probemos, ante todo, que la aplicación + es uní- 
voca. Sea XY =UY (X, Y, U, VEA) y, por consiguiente, Z- XY == 
=Z.UV. De (23) obtenemos Z+- X+*Y?=Z+.UwV. Puesto que Z? 
recorre todo el espacio B, de la última igualdad tenemos XY? = 
=UWV* y por esto la aplicación p es unívoca. Representando ahora 
la relación (23) en la forma (Zu)? =Zwu*, obtenemos para cuales- 
quiera v, wE L(A) 

Zt (o w)t = (Z (0-4 w))? = (Zo) w)? = (Zut) w <= Z? (u? 4104), 


de donde 


(+o =04 tut. (25) 


Análogamente, representando (24) en la forma (X+2u)?= X+. hu’, 
obtenemos 
X (ma)? =(X- (M1)? =X?-2ut, 
de donde 
(hu) = hut, (26) 


Las relaciones (25) y (26) significan que wp es un isomorfismo 
de L(%) sobre L(B). 

SUFICIENCIA Supongamos que dada la aplicación q: A— 8 del 
conjunto A sobre el conjunto B, la aplicación y: XY — XY? es 
un isomorfismo de (M) sobre L(B). Puesto que en un isomorfismo 
de espacios vectoriales el vector mulo corresponde al vector nulo, 
de Xv:=Y+* resulta X+Y?=0 y por esto XY =0 y X =Y, es decir, 
la aplicación ọ es biyectiva. Para demostrar ahora que para pes 
válida la relación (24), tomemos en % un punto U tal que XY =ZU: 
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Entonces se tiene 
(Z-XYp =U? =Z- U= Ze. XV? (27) 
y. en particular, 
(Zu) =Ztu* (uE L (A). 


Ahora resulta de (26) que 
(X-AXF)=X9-(AXV jt = XAXY? = XA XY” 


que es lo que se quería demostrar. 

COROLARIO t. Los espacios afines sobre un cuerpo conmutativo dado 
son isomorfos cuando, y sólo cuando, sus espacios vectoriales de tras- 
laciones son de una misma dimensión. 

Efectivamente, según el teorema 3, un isomorfismo entre espa- 
cios afines sobre un cuerpo conmutativo equivale a un isomorfismo 
de los espacios vectoriales de traslaciones y un isomorfismo de es- 
pacios vectoriales equivale (véase el p. 4.3) a la coincidencia de 
sus dimensiones. 

COROLARIO 2. Los automorfismos de un espacio afin U sobre un 
cuerpo conmutativo que dejan en su sitio un punto OEA son apli- 
caciones de tipo q: X—»0-0X?, donde wp es un automorfismo fijo 
có del espacio vectorial L(A). 

n efecto, siendo p un automorfismo del espacio A que deja 
en su sitio el punto O, se tiene 
7 =0- 0X7. 


X*=0-0X+=0- 
Recíprocamente, si p es un automorfismo de L(%), se tiene 
X= X+) (0-0Y+) =0Y+—0X+ =(0Y — 0X) = KV 


y por esto q es, según el teorema 3, un automorfismo del espacio Al. 

TEOREMA 4. Siendo O un punto arbitrario de un espacio afín Y 
sobre un cuerpo conmutativo K, todo automorfismo y del espacio Y 
sobre K puede ser representado en la forma 


Poe (28) 
donde «, es una traslación adecuada de U y qo es un automorfismo 
de Y que deja en su sitio el punto O. Para todo automorfismo y la 
descomposición de tipo (28) es univoca. 

Sea q un automorfismo del espacio A. Entonces la aplicación 


do =4-07Ó es un automorfismo de A y de las relaciones 
0-po=0*.000=0 


se ve que Qo deja en su sitio el punto O. Poniendc q,=00%, obte- 
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nemos la igualdad (28). Sea ahora 
=Po =08 PL”, 
(wD 


donde gf? es una traslación y p£” un automorfismo de A que deja 
en su sitio a O. Tenemos entonces 


0- AP oz'=0- pg '=0. 


Puesto que la traslación p£”pz* deja en su sitio el punto O, se 
tiene pz! =00, de donde gP =p; y gP =q0. 

29.2. Variedades lineales. Sea Y un espacio afín sobre un cuerpo 
conmutativo K. El espacio vectorial L(A) formado por las trasla- 
ciones de A lo indicaremos por £. A todo par de puntos X, Y € A 


corresponderá entonces un vector XV =XY de l y esta correspon- 
dencia satisfará los axiomas A, y A, del p. 29.1. Se llama dimen- 
sión del espacio afín U la dimensión del correspondiente espacio 
vectorial £. En particular, un espacio afin de dimensión O está 
compuesto por un punto solo. 

Unos puntos Xe X,, ..., Xm del espacio A se Haman lineal- 
mente independientes, si son linealmente independientes los vectores 
XKX XXa» 200, Xo Xy. Se dice que un punto XEM depende Line- 
almente de la sucesión de puntos Xy, X,, ..., Xm, Si el vector 
X¿X puede ser expresado linealmente en términos de los vectores 


En estas definiciones el punto X, desempeña un papel especial. 
Pero de hecho, la dependencia lineal no está ligada al orden de los 
puntos en la sucesión Xy, Xy...» Xp. Sea O un punto arbitrario 
del espacio A. Entonces se tiene 


XX ¡=0X¡—O0X, (i=0, 1, ..., m) 


y el hecho de que el sistema de puntos Xp ..., Xa sea lineal- 


mente independiente equivale a que para cualesquiera ^, ..., A. € K 
de la relación 


M (OX — OR.) +... Adm (OX n — 0X) =0 


se desprenda d, = . . . =A „= 0. Tomando A, =—A,— . . . —A p, Vemos 
que los puntos Xy, Xy, Xn son linealmente independientes cuan- 
do, y sólo cuando, para Cualesquiera My Ay ..., hmEK de las 


relaciones 
A A 
AOX, +HAOX +... +hgOX, =0 


se deduce que h=ħ =... =h = 0. 
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En esta afirmación no destaca ya ninguno de los puntos 
or Xy ++, Xm y por esto si la sucesión de puntos Xy, Xy, ..., Xm 

es linealmente dependiente, también será linealmente dependiente 
la sucesión Xa, Xn, .--, Xim cualquiera que sea la permutación 
fin i...» in) de los números O, 1, ..., m. Esto también se re- 
iere al concepto de dependencia lineal de un punto X respecto a 
una sucesión Xy, Xp ..., Xæ 

En las definiciones dadas se supone que la sucesión Xe, Xy, ..., Xm 
tiene no menos de dos términos (m > 1). Por definición, se acepta 
que un sistema compuesto de un punto es linealmente dependiente 
que el hecho de que un punto X dependa linealmente del sistema 
significa que X= X,. 

De los teoremas del p. 4.2 sobre la dependencia lineal de los 
vectores obtenemos directamente que 

a) una sucesión de puntos X, Xi, ..., Xm (m3>1) es lineal- 
mente dependiente cuando, y sólo cuando, al menos uno de sus tér. 
minos depende linealmente de los demás; pi 


b) si un punto X depende linealmente de los puntos Xy... X 
y todo punto X; depende linealmente de los puntos Y,, ..., Yp, él 
punto X depende linealmente de los puntos Y ,, , Ya 

c) si un punto X depende linealmente de los puntos X,, ..., Xm, 


el punto X depende linealmente también de los puntos Xy, Xy ===> Xn, 
donde X, es un punto cualquiera del espacio. 

De la propiedad c) se deduce que si un sistema de puntos Xp, 
Xy ..., Xm es linealmente independiente, cualquier subsistema del 
mismo que contiene más de un punto es también linealmente inde- 
pendiente, Esto permite introducir la definición siguiente: un con- 
junto arbitrario (finito o infinito) de puntes W de un espacio afín 
Y se llama linealmente independiente, si todo su subconjunto finito 
que contiene más de un punto es linealmente independiente. 

Análogamente se dice que un punto X € A depende linealmente 
de un conjunto de puntos M, si X depende linealmente de algún 
on pe finito de puntos de M. 

Se llama adherencia lineal de un conjunto cualquiera no vacío Wt 
de puntos de un espacio afín A el conjunto formado por todos los 
puntos X€ A que dependen linealmente del conjunto W. Un conjunto 
7 se llama linealmente cerrado si M coincide con su adherencia 
ineal. 

Los conjuntos linealmente cerrados de puntos de un espacio afin 
se llaman planos o variedades lineales del mismo. En otras palabras, 
un conjunto M de puntos de un espacio afín Y se llama plano 
de A, si cualesquiera que sean X,, ..., X EDI este conjunto con- 
tiene también cualquier punto del espacio Y que dependa lineal- 
mente de los puntos Xy, ..., Xm 

De aquí se deduce directamente que todo punto y el propio 
espacio A son indudablemente planos. 
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Dos planos W y N se llaman incidentes si uno de ellos está 
contenido en el otro. Si M SN, se dice también que M se encuentra 
sobre N (o que N pasa por M). 

Entre los planos de un espacio afín A y los subespacios lineales 
del espacio vectorial L (4) existe una relación muy simple que tam- 
bién se emplea a veces para di el concepto de plano. 

TEOREMA 1. Si para un conjunto M de puntos de un espacio afín 
A y un punto PEM el conjunto L(M) de lus vectores de tipo PX 
(XEM) es un subespacio lineal del espacio vectorial L(A), el con- 
junto W es un plano de A. Para cualquier plano no vacio Ùt de un 
espacio afin U y para cualquier punto PEW el conjunto L(M) de 
todos los vectores de tipo PX (X EM) es un Ea Sl lineal de L (XW) 
que no depende de la selección del punto P en Dt. 

Efectivamente, sea PED y sea L(AM) un subespacio de L (A). 


Si Xa -s XEM y un punto XE%A depende linealmente de 
Xi 0001, Xas se tiene entonces para unos valores convenientes 
Mar oeer AM EK 


PR=MPX +... Ha PX nE L (M), 


es decir, para un punto YEW? convenientemente escogido se tiene 
PX =PY, de donde X =Y €M. 

Recíprocamente, sea M un plano de A y sean P, X, YEM y 
A, HEK. Poniendo 


Q= P. (XPX +uPY), 


PQ=APX +uPY, 

es decir, el punto Q grde linealmente de P, X e Y y, por con- 
siguiente, QEM y PQEL(M) es decir, L(M) es un subespacio 
lineal de L(A). Para cualesquiera P, P,, XEM tenemos P,X = 
= PX—PP, y, por consiguiente, el conjunto de los vectores de tipo 
TIX (Kem) coincide con el conjunto de los vectores de tipo PX 
! Senales dos importantes corolarios que se desprenden del teo- 
rema 1. 

COROLARIO 1. Sea O un punto fijo de un espacio afin U, sea M 
un plano que pasa por O y sea P un punto arbitrario de A. Enton- 
ces el conjunto N=M-OP formado por todos los puntos desplazados 
del plano M es un plano de Y que pase por el punto P. Recíproca- 
mente, si N es un plano que pasa por P, el conjunto M=N-OP es 
un plano que pasa por O. 

En efecto, de OEM se deduce que P=0.-DPEN y para todo 
punto XEN existe un punto Y EM tal que X = Y-0P. De aqui se 
tiene YX =0P y PX=0Y y por lo tanto L (M) =L (M.-P). 


vemos que 


221843 
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coroLario 2. Para todo punto fijo O de un espacio afin Y la apli- 
cación X—0X (XEM) determina una correspondencia biyectiva 
entre los subespacios lineales del espacio vectorial L(A) y los planos 
del espacio A que pasan por O. 

La demostración es evidente. 

Hemos señalado en el p. 29.1 que si llamamos punto a todo vector v 
de un espacio vectorial L y si tomamos uw=w=—o, se obtiene el 
espacio afín A sobre £. ¿Qué conjuntos de vectores de & serán 
los planos de A (£)? 

'omando por el punto fijo O de A (2) el vector nulo, vemos que 
la aplicación X—»0OX, de la cual se trata en el corolario 2, se 
convierte en la aplicación idéntica w-—w. Luego, son planos del 
espacio A(%) que pasan por O todos los subespacios lineales 
del espacio Y, y sólo ellos. Los planos que pasan por un punto 
arbitrario pEL son, según el corolario 1, los conjuntos de vectores 
de tipo p-+WM, donde M es un subespacio lineal del espacio L, 

Se llama base de un plano arbitrario Wi de un espacio afín A 
todo conjunto linealmente independiente de puntos, cuya adheren- 
cia lineal coincide con Mi, Está claro que un conjunto de puntos 
A (€ 1) de un plano M es una base del plano WM cuando, y sólo 
cuando, el conjunto de vectores A,A; (i€ 1), donde A, (a€ /) es un 
punto arbitrario fijo, es una base del espacio vectorial L(M). En 
virtud del teorema sobre las bases de los espacios vectoriales del 
p. 4.2 tenemos: 

a) todo plano de un espacio afín posee una base; 

b) si un plano M está contenido en un plano M, toda base del 
plano Mes una parte de una base convenientemente escogida de Ñ; 

c) todas las bases de cualquier plano fijo Mi son de una misma 
potencia igual a dim.L(M)+1. 

Se llama dimensión de un plano M de un espacio afin Y la 
dimensión del espacio vectorial L(M) que le corresponde. De la 
propiedad c) se deduce que la dimensión de un plano es igual a la 
potencia de cualquier base suya disminuida en 1. El conjunto vacío 
de vectores de un espacio afín Y se llama a veces plano vacío de A 
de base vacía. La dimensión del plano vacío se toma, por defini- 
ción. igual a —l. 

Los planos O-dimensionales son los puntos del espacio Y. Los 
pianos unidimensionales se llaman recfas (o líneas rectas) del espacio 
I. Cualesquiera dos puntos distintos de una recta forman una base 
de la misma y por cualesquiera dos puntos distintos de un espa- 
cio M pasa una recta, y sólo una. En general, cualesquiera 4+1 
puntos linealmente independientes de un plano de dimensión k for- 
man una base de este plano y por esto por cualesquiera k-+1 pun- 
tos linealmente independientes (k es un número finito) de un espa- 
cio afin A pasa un plano f-dimensional de este espacio y sólo uno. 
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Siendo W y N dos planos cualesquiera de un espacio afín A, 
convendremos en indicar por W V N la adherencia lineal del conjunto 
MuUN. El plano MVN se puede definir también como la inter- 
sección de todos los planos del espacio Y que contienen a los planos 


La operación Y, considerada como una operación binaria definida 
sobre el conjunto de todos los planos de un espacio afín, es con- 
mutativa, asociativa e idempotente (es decir, MM =2M); además, 
para cualesquiera planos W y N de un espacio A se tiene 


MSNSOMVN=N. 


Por ejemplo, siendo X,, ..., X un conjunto finito de puntos 
de un espacio Y, se tiene que 


M=X,VX,V...V Xa 


es la adherencia lineal de dicho conjunto, es decir, es el menor 
plano que pasa por los puntos X,, ..., Xn. La dimensión de M 
es igual al número máximo de puntos linealmente independientes 
en el conjunto X,, ..., Xa disminuido en 1. En particular, 


dim. (X,VX,V...VX a) <m=1. x 


Es fácil ver que tiene lugar el siguiente teorema general: 
TEOREMA 2. Cualesquiera que sean los planos M y Nde un espacio 
afin A se tiene 


dim. (MVH) < dim. M-+ dim. N+- 1. a) 
Si los planos W y N poseen un punto común, se tiene 
dim. (MVN) + dim. (M NN) = dim. M -+ dim. N, D 


Demostremos primero la igualdad (2). Sea OEMNN, Entonces, 
la aplicación X — OX del espacio A sobre el espacio vectorial L (Y) 
transforma los planos de A que pasan por el punto O en los sube- 
spacios lineales del espacio vectorial L (A), con la particularidad de 
que conserva las dimensiones y la relación de inclusión. Por esto 
la fórmula (2) es un corolario directo de la fórmula análoga que 
tiene lugar para los subespacios lineales de los espacios vectoriales 
(véase el teorema 1 del p. 6.1). 

La estimación Y se deduce de la fórmula (2). Efectivamente, 
si los planos M y N poseen un punto común, tenemos según (2) 


dim. (M V NM) < dim. M + dim. N. B 


Sea MNN=Ø. Agregando el punto OEM a una base del plano 
M, obtenemos una base de OVN, es decir, 


dim. (OVR) = dim. N+ 1. 0) 
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Puesto que los planos M y OVN poseen el punto común O, 
tenemos basándonos en (3) 


dim. (M V N) = dim. (M V O V N) L dim. M-+dim. (0 V N), 


y de aquí, debido a (4), obtenemos (1). 
Por lo tanto, si los planos M y Ñ no tienen puntos comunes, 
la dimensión de WM Y N está comprendida en los límites siguientes: 


máx (dim. Wt, dim. N) < dim. (M V N) < dim. M-+dim.N+ 1. 


Es fácil comprobar, considerando ejemplos, que la dimensión 
de M YN puede tomar efectivamente cualquier valor comprendido 
en estos límites. 

A todo plano M de un espacio afín arbitrario A le corresponde 
el subespacio lineal L (N) del espacio vectorial L (4). Según el $ 6 
(véase el problema 3 de la pág. 113), en L(%) existe un subespacio 
complementario &, que satisface las condiciones 


L(M+2,=L(% y LWN =0, 


donde o es el vector nulo del espacio L (A). La dimensión de Re 
que es la misma para todos los subespacios complementarios, se 
llama codimensión de GR) en L(%). Por definición, se llama co- 
dimensión de un plano M en un espacio A la codimensión del sube- 
spacio vectorial L(M) en el espacio vectorial L (9). 

Esta definición puede darse de otra forma. Para todo plano M 
diremos ge un plano N es complementario de M en el espacio Y, 
si MY N=4A y si la intersección MNN consta sólo de un punto. 
Está claro que, en estas condiciones, el subespacio L (N) es comple- 
mentario de L (M) en L(A) y por ello la codimensión de un plano 
Mi en el espacio Y es igual a la dimensión de cualquier plano com- 
plementario. 

Puesto que los planos reciprocamente complementarios poseen 
un punto común, obtenemos, aplicándoles la fórmula (2), la igualdad 


dim. M-+-codim. M= dim. A. (5) 
Si el espacio U es de dimensión finita, obtenemos de (5) 
codim. M= dim. U— dim. M. (6) 


Para un espacio A de dimensión finita obtenemos de las fór- 
mulas (2) y (6) el resultado siguiente: 
TEOREMA 3. Para cualesquiera dos planos M y N que se intersecan 
de un espacio afín % se tiene 
codim. (M NM) + codim. (M V N) =codim. M-+codim.N. (7) 


No obstante, es fácil ver que la fórmula (7) es válida también 
para los espacios de dimensión infinita. 
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COROLARIO. Si la intersección de los planos My, Ny, ..., N, de 
un espacio afin A arbitrario es no vacía, se tiene 


codim. (N, N ... NN) < codim. Ny +... pcodim.N,. — (8) 


Para s=2, la fórmula (8) se desprende directamente de (7) y en 
el caso general ella se obtiene aplicando sucesivamente la fórmula 
del caso particular indicado. 

Si el plano D se encuentra sobre el plano 9 de un espacio A, 
entonces, considerando N como el espacio afín sobre L(V) e indi- 
cando por codim.„ Iè la codimensión del plano WM en el espacio N, 
obtenemos la fórmula 


codim. „M+ codim. N= codim. M ©) 


que se demuestra fácilmente pasando a los subespacios del espacio 

vectorial L (X). De la fórmula (9) se deduce, en particular, que si 

la codimensión del plano M en N es finita y MEN, se tiene 
codim. N < codim. M—1. (10) 


Los planos de codimensión igual a 1 se llaman híiperplanos. En 
otras palabras, en un espacio afín de dimensión finita n se llaman 
hiperplanos los planos de dimensión n—1. Luego, por cada n pun- 
tos linealmente independientes de un espacio de este tipo pasa un 
hiperplano, y sólo uno. 

Consideremos ahora un conjunto cualquiera finito de hiperplanos 
Pis ..., Y, de un espacio afín arbitrario A. Debido a la fórmula (8) 
tenemos 


0< codim. (R, N... NP) <s. (11) 


Se dice que los hiperplanos $,, ..., P, (para s no mayor que la 
dimensión de %) se encuentran en posición general, si tiene lugar 
la igualdad exacta 


codim. (R, N... NP) =s. (12) 
Probemos que para todo ¿<s de (12) resulta 
codim. (R, N... NP) =t. 
En efecto, si fuese 
codim. (R, N-..NB)<f, 
tendríamos, debido a (8) y a (11), 
codim. (BN... ABIN (Pea N -NB < t+ tes 


lo que estaria en contradicción con (12). 
TEOREMA 4. Todo plano M de una codimensión fi 
tersección de s hiperplanos convenientemente escogidos. 
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Tomemos una base de M y complementémosla con unos puntos 
An +., As hasta obtener una base de todo el espacio Al. Sea $, 
la adherencia lineal del conjunto MULA), -.., Aai Aves, de 
Como RHA y P;VA =M, resulta que P, es un hiperplano 
(i=1, ..., $) y que 
MSRBN...NP. 
De A; P, tenemos 
ASR SRN >... BN. Po, 

de donde, debido a (10), 


codim. (B,N ... NB) >s. 


Comparando esta desigualdad con (11), obtenemos 
codim. (R, N... NP) =s. 
Puesto que las codimensiones de los planos M y $, N... NB, coin- 
ciden y el primero está contenido en el segundo, ambos planos, 
debido a (11), coinciden que es lo que se quería demostrar. 

Para terminar, haremos unas observaciones relacionadas con la 
definición del concepto del plano aceptada más arriba. Esta defi- 
nición puede ser enunciada de nuevo en la forma siguiente: un con- 
junto M de puntos de un espacio afín Y se llama plano, sí para 
lodo número natural s y para toda sucesión A,, , A, de puntos 
de Wt cualquier punto del espacio Y, que dependa linealmente de 
los puntos de la sucesión mencionada, pertenece a M. De hecho, es 
suficiente tomar en esta definición s=3 y para varios tipos de cuerpos 
conmutativos principales K es suficiente tomar incluso s=2. Tiene 
lugar concretamente el teorema siguiente: 

TEOREMA 5. Sí un conjunto M de puntos de un espacio afín YU con- 
tiene con tres cualesquiera puntos suyos todos los puntos de A que 
dependen linealmente de éstos, el conjunto M es un plano. Si A es 
un espacio afín sobre un cuerpo conmutativo K, de caracteristica di- 
ferente de 2, y si un conjunto M con dos cualesquiera puntos suyos 
contiene todos los puntos de U que dependen linealmente de éstos, el 
conjunto M es un plano de A. 

Demostremos la segunda afirmación. Supongamos que un conjunto 
M cumple las condiciones de esta afirmación y que Xq X., X, 
es una sucesión de puntos de Mi. Debemos demostrar que para cua- 
Jesquiera A, ...,2,€K la relación 


A A 


implica X €M. Para s=1 esto es válido por el enunciado mismo 
del teorema. Aplicando ahora la inducción, aceptamos que la impli- 
cación indicada es válida para un s>1. Sea 


O A 
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Consideremos unos puntos X y Z que satisfacen las condiciones 
XX =MX XX +. +A XX, y Kiha AA 


> la hipótesis de inducción, de estas relaciones resulta que 
XEM y ZEM. Tomando ahora (fig. 5) 


XB=>3 (IX+XD, 
vemos que el punto B depende linealmente de X y de» Z y que el 
punto Y depende linealmente de los puntos X, y B. Basándonos 
en las condiciones del teorema, obtenemos 
de aquí sucesivamente que BEM e YEM E 
que es lo que se quería demostrar. La pri- 
mera afirmación del teorema 5 se demuestra 
análogamente, pero sin emplear el punto B, z 
y por esto ella es válida independiente. a 
mente de la caracteristica del cuerpo con- x 
mutativo K. Es fácil ver que para cuerpos 
conmutativos de caracteristica 2 la segunda X 
afirmación no tiene lugar. e 
Hemos introducido en el p. 29.1 dos Fig. 5. 

conceptos principales: el de un espacio afín 
sobre un espacio vectorial y el de un espacio afín sobre un 
cuerpo conmutativo. En este” punto hemos considerado hasta el 
momento los espacios afines sobre los espacios vectoriales. Sea 
ahora A un espacio afin sobre un cuerpo conmutativo K y sean 
S(X, Y, Z) y P(X, Y) las operaciones principales de A, Hemos 
visto ya en el p. 29.1 que las traslaciones de A son unos automor- 
fismos del espacio A sobre K de tipo especial. Demostremos ahora 
que un punto X de un espacio A depende linealmente de unos puntos 

or Xis +s: Xa de Ml cuando, y sólo cuando, X se expresa en forma 
de un polinomio en X, .. € mediante las operaciones S y P,. 

En efecto, si 


XX MX Xp 4 -Hha X Xm 
donde A, ..., Aa EK, se tiene según el p. 29.1 
X= (XA XX). o) AK Xa (13) 
Pero para cualesquiera B, C, ZEA y AEK se tiene 
ZABC=S(B, P, (B, C), Z). 


Transformando mediante esta fórmula el segundo miembro de la 
igualdad (13), obtenemos la expresión requerida de X en forma de 


un polinomio en X,, X, ..., Xy. Recíprocamente, de 
X=S(Y, Y, Y) y Z=P, Y, Y) 
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se deduce que 


A=VYY, e Vl= Y. 
es decir, que X y Z dependen linealmente de Y, 
si X se expresa en forma de un polinomio en X, 
punto X depende linealmente de X, X, ... 

Según la definición, un conjunto Wt de puntos de un espacio Y 
se llama plano, si este conjunto Wi con cualesquiera puntos suyos 

X, contiene también todos los puntos de Y que dependen 

linealmente “de éstos, es decir, contiene los valores de todos los po- 
linomios en X,, ..., Xy. En otras palabras, los planos de un 
espacio A son simplemente subálgebras del álgebra % y las adherencias 
lineales son las subálgebras generadas por los elementos de los con- 
juntos correspondientes. 


29.3. Planos paralelos. Hemos visto ya que para todo plano M 
de un espacio afín Y el conjunto L (MM) de todos los vectores de tipo 
XY(X, YEM) es un subespacio del espacio vectorial L(A). El 
subespacio L (M) suele llamarse frecuentemente subespacio tangente 
al plano WM. 

DEFINICION. Los planos M y N de un espacio U se llaman para- 
lelos (notación simbólica WIN), si sus espacios vectoriales tangentes 
L (W) y L (N) son incidentes, es decir, si L (D) = L(NjoL(M = L (M). 

De esta defi ón se desprenden inmediatamente varios corola- 
rios importantes. 

COROLARIO 1. Dos planos Wt, y M, que se intersecan son paralelos 
cuando, y sólo cuando, uno de ellos está contenido en el otro. 

Efectivamente, si M, y M, tienen un punto común O, entonces 
L(M) (i= 1, 2) es el conjunto de vectores de eS OX (XEM) y por 
ello la incidencia de los espacios tan entos L(M,) y L(W,) equivale 
a la incidencia de los planos M, y 3 

COROLARIO 2. Si los planos M,, E % M, son de una misma di- 
mensión finita (o de una misma codimensión finita) y M, |M, y 
MI, liM, se tiene W || D,. 

Las dimensiones (las codimensiones) de los espacios tangentes 

L (MM) son finitas e iguales. Por ello la incidencia de L(M) y L (AM) 
equivale a la coincidencia de los mismos y la afirmación del coro- 
lario se reduce a la observación trivial de que L(M)=L(M,) y 
L(A,) =L (M,) implican! L (M,) = L (M.). 

El corolario 2 significa que para cualquier £ finito todos los 
planos -dimensionales de un espacio afín arbitrario A se descom- 
ponen en haces de planos paralelos entre sí. Estos haces se llaman 
a veces direcciones k-dimensionales en A. 

COROLARIO 3. En un espacio afín Y se tiene 

MM-u 
para cualquier plano M y para cualquier traslación u€ L(A). 


Y, y por esto, 
el 


oero Amo 
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Efectivamente, el espacio tangente L(M-u) está formado por 

vectores de tipo XuYu (X, Y €M). Pero 
XuYu=XuX + XY 4+YYu=—u+XY +u = XY 
y por ello L (M-u)= L (M). 

COROLARIO 4. Por fodo punto B de un espacio afín pasa un hi- 
perplano $, y sólo uno, paralelo a cualquier hiperplano WM dado de 
antemano. 

Si BEM, se ve del corolario 1 que el único hiperplano que pasa 
por B y es paralelo a WM, es el propio hiperplano M. Podemos 
aceptar, pues, que BEM. En virtud del corolario 3, el hiperplano 
m-OB(O€M) pasa por B y es paralelo a M. Si existe otro hi- 
perplano Xt que pasa por B y tal que NIM, tenemos, según el 
corolario 2, N[|¡M-DB y entonces, en virtud del corolario 1, N yM-DB 
son incidentes. Pero los hiperplanos incidentes coinciden que es lo 
que se quería demostrar. 

TEOREMA 1 Si un hiperplano $ y un plano N de un espacio afín N 
no se intersecan, resulta que Y es paralelo a N. 

Queremos demostrar que L (X) = L (P). Supongamos, al contrario, 
que para unos puntos A, BEN el vector AB no pertenece a L (R). 
Tomemos un punto cualquiera O € $ (fig. 6) 
y consideremos el vector JA . Puesto que 
Y es un hiperplano, se tiene 


L(0 =L(B)+L(AVB) 


y por ello para XER y UE AVE conve- 
nientemente escogidos tenemos DA =0X— 
—AU, de donde DU=0X y, por consi- 
guiente, U = X, lo que contradice a la con- 
dición de que Palea. 
TEOREMA 2. Para que dos planos M y N Fig. 6. 
que no se intersecan sean paralelos, es nece- 
sario y suficiente que uno de ellos sea un hiper plano en el espacio M V N. 
La suficiencia está contenida directamente en el teorema 1. 
Demostremos la necesidad. Sea L(N)=L(4M) y sea AEN. Es sufi- 
ciente demostrar que M V R Æ M V A. El plano M V N está formado 
por aquellos puntos X que dependen linealmente de unos puntos 
A, X=... X, de M y unos puntos Y, ..., Y, de M. Es decir, 


MAY, E A MAY + AX +. AX, == 
+u)AO+0Z (YEN y O, ZEM). 
Tenemos, por hipótesis, AY € L(M) = L(M) y, por consiguiente, 


AY =0U (UEM). De aquí se desprende que AX € L(MVYV A) y por 
lo tanto XEMVYA. 


346 Cap. VIIL. Espacios afines 


COROLARIO 1. Si los planos M y N son de dimensión finita y no 
se intersecan, estos planos son paralelos cuando, y sólo cuando, 


dim. (M V MN) =máx (dim.M, dim. NF 1. (1 


La demostración es obvia. En particular, de este corolario sacamos 
la conclusión de que dos rectas que no se intersecan son paralelas 
cuando, y sólo cuando, se encuentran sobre un mismo plano bidi- 
mensional. Análogamente, una recta y un plano bidimensional que 
no se intersecan son paralelos cuando, y sólo cuando, se encuentran 
en un mismo plano tridimensional, etc. 

COROLARIO 2. Cualquiera que sea el número finito k> 0, por todo 
punto B de un espacio afin % pasa un plano Y k-dimensional, y sólo 
uno, paralelo a un plano k-dimensional W dado de antemano. 

Podemos limitarnos a considerar el caso en que BÉM. Debido 
a la fórmula (1), el plano $ debe ser un hiperplano del espacio 
M VB y por ello el asunto se reduce al corolario 4 de la definición 
de los planos paralelos. 


29,4, Funcionales lineales. Una función f:A-—K, definida sobre 
el conjunto de todos los puntos de un espacio afín A y con valores 
en el cuerpo conmutativo principal K, se lama funcional sobre A. 


El çoncepto de una funcional sobre M es un caso particular del concepto 
de una función que está definida sobre un conjunto arbitrario y cuyos valores 
pertenecen a un cuerpo conmutativo dado K. Para estas funciones hemos definido 
sa el pi del los conceptos de una suma y de un producto de un número por 
una función, resultando que el conjunto de todas las funciones forma, respecto 
a estas operaciones, un espacio lineal, cuya dimensión coincide con la potencia 
del conjunto que sirve como el dominio de definición. 


Una funcional f, definida sobre un espacio afín A, se llama 
lineal (o afín) sobre A, si para cualesquiera O, P, Q, REA y A, 
HE K que cumplen la relación 

OR =10P 4100 0) 
tiene lugar la igualdad 
HR) =A HP) HON + u C (Q) —F (0)) +F (0). (2) 

Demostremos que para toda funcional lineal f es válida la im- 

plicación 
: p 
KR = DARK 3 (X)= Eu AHAD), 3) 


cualesquiera que sean Xo Xy .00+ Xn XEM y dy ooe, AEK. 
Para s =2 la implicación (3) coincide la implicación (1) =>(2) que 
define la linealidad def. Aceptemos ahora por inducción que la impli- 


E 
cación (3) es válida para un valor fijo s >2, Sea X,P= 2:4, X,X;. Con- 
£ 
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siderando un punto X que cumple la condición X,X'=2) 4, XX, obte- 
al 


nemos (3). Después, de la relación X37 = X; X +44, XoXzo1 y de la im- 
plicación (1) = (2) obtenemos 


E= HOEK) HA F(X EXD O = 


e 
= B MXD XD HX) 


que es lo que se queria demostrar. 

Está claro que todas las funcionales constantes son lineales. Es 
también evidente que la suma de unas funcionales lineales y el 
producto de un número por una funcional lineal son de nuevo fun- 
cionales lineales. Por esto el conjunto de todas las funcionales li- 
neales sobre un espacio afín A es un espacio lineal. Este espacio 
se indica por A, y se llama conjugado de Y. El conjunto de todas 
las funcionales constantes es un subespacio lineal de dimensión uno 
del espacio Ay. 

LEMA. Si f es una funcional lineal sobre un espacio afin A y 
para unos puntos A, BEA se tiene [(A)=*f(B), entonces en la 
recta AVB existe un punto X tal que [(X)=a cualquiera que sea 
ack. 

Tenemos para un punto arbitrario X € AVB 


AX=2-AB AEK), (4) 
de donde, en virtud de (2), 


1) =2>(B) FA) +F (A). 
Por ello, tomando para A el valor 


A=(a— HAD (B)—(FH(AD", 


obtenemos de (4) el punto requerido XE AVB tal que f(X) =a. 

TEOREMA 1 Para toda funcional lineal no constante f sobre un 
espacio afín A, el conjunto de los puntos XEA en los que f loma 
un valor fijo «E K es un hiperplano de A. Reciprocamente, para todo 
hiperplano W y cualquier «€ K existe una funcional lineal f, cuyos 
valores son iguales a a sobre M y diferentes de a fuera de M. 

Demostremos la primera afirmación. Sea Mt el conjunto de los 
puntos XEM en los que f(X)=a. Puesto que la funcional f no es 
constante sobre A, tendremos f(4)=ef(B) para unos puntos A, 
BEM convenientemente escogidos. Según el lema, de aquí se deduce 
que en la recta AVB existe un A X perteneciente a Wt, de modo 
que el conjunto W no es vacío. Si Xy, Xy, ..., XEM y X es un 
punto que depende linealmente de éstos, se tiene 


AJ=HX)=. =[(X)=a 6) 
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y para unos valores adecuados A, ..., A¿€K se tiene 
X= XX +. +2 Moo (6) 
De las fórmulas (6), (3) y (5) encontramos f(X)=0, es decir, 
XEM. En otras palabras, el conjunto M es un plano de A. Resta 
demostrar que codim. M=1. Como la funcional f noes constante, 
existe un punto A tal que f(A)=*a y 
ži 4 Por ello AEM. Tomemos un punto cual- 
quiera XEN demostremos que 
XEAVM. Si f (X)=a, tenemos XEM 
y no hay nada que demostrar. Sea, 


n Ñ > por esto, f(X)+a y sea MEM. En la 
recta AVM (fig. 7) existe, según el lema, 
Fig. 7. un punto B en el cual f (B) f(X) y, 


or ello, en la recta BVX existe un 
punto M EM.: Vemos que depende linealmente de B y de N y 
que B depende linealmente de A y M. Luego, X depende lineal- 
mente de A, M y: N y XEMVA. 
Demostremos ahora la segunda afirmación del teorema. Sea 
A=MVA y sea MEM. Para todo punto XEM existe entonces 
una descomposición de tipo 


MX=%»MA+MU (MEK y UEM) 


y sólo una. Introduciendo la funcional f.(X)=2, vemos que ella 
es igual a O sobre M y es diferente de O fuera de M y que la 
funcional F(X)=f. (X) +a es igual a a sobre M y es diferente de 
a. fuera de M. Por lo tanto, resta sólo demostrar que la funcional 
fo es lineal. Sea 


e ES R Ka 
MX, =0,/MA+ MO, (UEM; 120, 1, 0.5 P 


y, por consiguiente, f.(X)=a¿ (1=0, 1, ..., s) Como XX, = 
= MX ;— MX., de las fórmulas (7) obtenemos 
MX, ¡MX + EA) (MX,—MX)=(Z0/0;—Ma)+0,): MA+-MO, 
de donde 

ho(X q) = DA HAD — EXD + FX) 
que es lo que se quería demostrar. 

El conjunto de aquellos puntos XEM en los que la funcional 
dada f o el sistema de funcionales f; dado se anula se llama varie- 
dad radical de la funcional (o del sistema de funcionales). Por’ 
esto el teorema | equivale a la afirmación de que la variedad ra- 
dical de una funcional lineal no constante es un hiperplano y de que 
todo hiperplano es la variedad radical de una funcional lineal ade- 


$ 29. Espacios afines generales 349 


cuada. Si la funcional es constante, su variedad radical es, obvia- 
mente, o bien vacía o bien coincidente con Y (funcional nula). La 
variedad radical de un sistema de funcionales es la intersección de 
las variedades radicales correspondientes a las funcionales del sis- 
tema dado. Por lo tanto, la variedad radical de un sistema arbi- 
trario de funcionales lineales es un plano (posiblemente vacío o 
coincidente con todo el espacio Y). 

Hemos demostrado en el p. 29.2 que todo plano WM de codi- 
mensión finita s => 1 puede ser representado en la forma M=%, N 
<. Aa, donde Pr, $, son unos hiperplanos adecuados. 
dicando por f; la funcional lineal, cuya variedad radical es Y, ve- 
mos que WN es el conjunto de aquellos puntos X€%, para Jos cua- 
es 


ÍAX)=0, ..., f,(X)=0. (8) 


Considerando el problema recíproco, preguntémonos ¿para qué 
funcionales lineales E .--» fs la correspondiente variedad radical 
(8) resultará ser un plano de codimensión $? 

TEOREMA 2. Para que la variedad radical de un sistema de funcio- 
nales lineales f,, ..., f, sea un plano de codimensión s, es necesario 
y suficiente que las funcionales f,, ..., f, sean linealmente indepen- 
dientes (en Ay) y que posean al menos un punto radical común. 

ar Indiquemos por $, la variedad radical de la funcio- 
nal fy 


P(X) =f (X) «Hama (X) (X EA), 


se tiene R, N... N Ps- S P, Luego, resulta que codim. (%8, N... N P) = 
=codim. (P, N... NP.) s y, por consiguiente, ias condiciones 
del teorema son necesarias. 

SUFICIENCIA. Tomemos 


M=, N... NP NR 


Tenemos, según el p. 29.2, codim. M< s. Supongamos que co- 


dim. M <s. Existen entonces en A unos puntos Á,, ..., A 
tales que 


9-1 


A==MVA,V...VAs. (9) 


Consideremos todas las funciones definidas sobre el conjunto 

f 1 ===, As-,) con valores en un cuerpo conmutativo K. “Estas 
unciones forman un espacio lineal, cuya dimensión es igual a s— 

si los puntos A,, ..., As, son diferentes, y es menor que s— 

si algunos de estos puntos coinciden. Es decir, el espacio de las 

funciones definidas sobre (4,, ..., A,.,) es de dimensión no mayor 

que s—1 y por ello al menos una de s cualesquiera funciones de- 

. finidas sobre el conjunto señalado puede ser expresada linealmente 
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en términos de las demás. En particular, si consideramos las fun- 
cionales f,, ..., fs sólo sobre el conjunto (4, ..., Ası}, una de 
ellas puede ser sin duda alguna expresada linealmente en términos 
de las restantes. Sea, por ejemplo, 


LX) == (XH + H tsas- (X). (10) 


Esta igualdad es válida para todos los puntos X=A,,..., Aş-1 
Basándonos en que las funcionales consideradas son lineales y se 
anulan sobre el plano M y empleando la relación (9), veremos fá- 
cilmente que la igualdad (10) es válida para todos los puntos X € Y, 
es decir, que las funcionales f,, ..., fs son linealmente dependien- 
tes y con ello queda demostrada la suficiencia de las condiciones. 
En efecto, de (9) se deduce que para todo punto X€% existen 
unos puntos O, YEM y unos números ^, ..., As., tales que 


OX = MDA, +... +2. 0A; -1 +0Y; 
luego, f; (0) =f,(Y)=0 y en virtud e (3) tenemos 


LOO=A AA A hi) i=l, 0, 5% (10) 
Teniendo en cuenta que la igualdad (10) es válida para X=4) 
(i=1, ..., s—1), obtenemos de (11 


L= LAA) = D MZ afa (A) = 
= E QUA) a OH. Host (X) 


que es lo que se quería demostrar. 


COROLARIO 1 Supongamos que un plano M de un espacio afín Y 
es de codimensión finita s. Entonces el conjunto ML de todas las 
funcionales lineales sobre A iguales a O sobre M, es un espacio ve- 
ctorial de dimensión s. 

Efectivamente, si Mt contiene unas funcionales f,, ..., fep, li- 
nealmente independientes y si $; es el hiperplano radical de la fun- 


cional fy, tenemos 
MEP, N.. NAPs 


codim. M >s +1. 


En cambio, si todas las funcionales lineales de M se expresan 
linealmente en términos de f, ..., f,-,» se tiene 


M=, N... NPs- 
y, por consiguiente, codim. M < s—1. 


COROLARIO 2. Para todo espacio afin A la dimensión del espacio 
conjugado Y, es mayor en 1 que la dimensión de A. 


y, por ello, 
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Sea B(4¡|1€ 1) una base de A y sea F una función cualquie- 
ra que está definida sobre B y toma valores en K. Fijemos un 
punto cualquiera O€B. Para todo punto XEM existe un sistema 
Mi,» +=.» AEK definido univocamente que cumple la condición 


OR =M04, +... HADA. 
Definamos mediante la función F la funcional 
HX) = Eha (F (An) —F (0) +F (0). 
Se comprueba fácilmente que la funcional f es lineal sobre A 
y que F— f es un isomorfismo del espacio vectorial de las funcio- 


nes, definidas sobre Y, sobre el espacio vectorial A,. Por lo tanto, 


la dimensión de A, es igual a la ¿piensa de la base Y, es decir, 
es mayor en 1 que la dimensión de A. 


Complementos y ejemplos 


1. Sea A un espacio afín sobre un espacio vectorial L£=L (A). Para todo 
plno MEN, indiquemos por M el conjunto de las funcionales lineales sobre 

que son iguales a O sobre M. Reciprocamente, para todo conjunto 1 de 
funcionales lineales, indiquemos por UT la variedad radical de ll. Entonces, 
para un espacio A de dimensión arbitraria es válida la siguiente ley de dualidad: 
para todo plano no vacio MA se tiene (Mt)T =M y la dimensión de M 
es igual a la codimensión de M+ en el espacio lineal Ay de todas las funcio» 
nales. lineales sobre W. Recíprocamente, si un subespacio lineal Uc Y, no 
contiene funcionales constantes diferentes de cero, se tiene UT s ø, (UT)L=u 
y la dimensión de U es igual a la codimensión de UT en Y. 

2. HOMOMORFISMOS DE ESPACIOS AFINES. Los espacios afines sobre un 
cuerpo conmulativo K son unas álgebras de signatura fija y, por ello, se puede 
hablar de homomorfísmos, congruencias y espacios coientes de los espacios afines 
sobre K. Es fácil ver que siendo 8 una congruencia sobre un espacio alin Y, 
las clases de equivalencia según 8 son los planos que se obtienen uno de otro 
mediante traslaciones y que son, por ende, paralelos. Reciprocamente, si M es 
un plano, todos los planos paralelos a éste, que se obtienen de M mediante 
trasiaciones, forman el sistema de clases de equivalencia según una congruencia 
Op sobre Y. La dimensión del espacio cociente Y/O es igual a la codimen- 
sión de M. 

3. De los axiomas Aj, At y Aj se ve que la clase de todos los espacios 
afines sobre un cuerpo conmutativo fijo K se define mediante identidades, es 
decir, que esta clase es una variedad de álgebras. Por ello se puede hablar de 
espaciós afines libres sobre un cuerpo conmutativo K provistos de un sistema 
dado de generadores libres. Puesto que una base de un espacio de dimensión 
finita es un sistema de generadores del mismo, el número de sus elementos 
disminuido en 1 coincide con la dimensión de A y como todos los espacios de 
una dimensión dada son isomorfos, todo espacio afín A sobre K es un espacio 
líbre y los elementos de cualquier base de Y son los generadores libres de Y. 

A gnóiquemos por x 8 el producto cartesiano de los espacios afings 
X y B sobre un cuerpo conmutativo fijo K (comprendido como el producto 
cartesiano de las álgesras U y B). Demuéstrese que el espacio vectorial de las 
trastaciones £ (W x Y) es isomorfo a la suma directa de los espacios L (Y) y L (B). 
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En particular, un espacio afín de dimensión finita n es isomorío al producto 
cartesiano de'n espacios afines de una dimensión. 

5. Indiquemos por G el grupo de los automorfismos de un espacio afín Yl- 
Para todo punto O € A indíquemos por Go el conjunto de todos los automorfis- 
mos de % que dejan inmóvil el punto Ô. Sea, finalmente, D el conjunto de 
todas las traslaciones de Y. Es fácil comprobar que Go es un subgrupo de G y 
que D es un subgrupo abeliano invariante de G. De acuerdo con el teorema 
4 del p. 29.1, tenemos la descomposición semidirecta 


0=07D (Go N D=1, 


de la cual se deduce, en particular, que el grupo cociente G/D es Isomorlo 
a Go. Si el espacio A es de una dimensión, el grupo Go es isomorfo al grupo 
multiplicativo del cuerpo conmutativo K y es por lo tanto 
abeliano, mientras que el grupo G es meteabeliano. 
6. Compruébese, en las notaciones del complemento 
anterior, la igualdad 


A0-G7:DA=04-1.09:DÁ=6p. 


7. Como hemos visto en el teorema 6 del p, 29.2, si 
A la característica del cuerpo conmutativo K es diferente de 
Fig. 8 2, todo conjunto M de puntos de un espacio afin sobre K 
que con dos cualesquiera puntos distintos suyos contiene 
también toda la recta que pasa por éstos, es un plano. Para cuerpos de carac- 
terística 2 esto, en general, no es válido. Sea K el cuerpo conmutativo formado 
por dos elementos O y I sea £ el espacio vectorial de pares (r. 4) (e, y € K) 
S Sea Q el espacio alla sobre € (fig, 8). Se comprueba fácilmente que M tene 
en total 4 puntos y 6 rectas. El conjunto M=((0, 0), (0, 1), (1, 0)} no es un 
pleno, aunque con cualquier par de sus puntos contiene la recta que pasa por 
los mismos (que coincide con este par). 


$ 30. Coordenadas afines 


30.1. Coordenadas de un punto. Sea A un espacio afin de dimen- 
sión finita n sobre un cuerpo conmutativo K. Según el p. 29,2, toda 
sucesión (Ay Ay -.., An) formada por n-+1 puntos linealmente 
independientes del espacio YU se llama base de A. Una sucesión 
(Av U» ---» Un), formada por un punto cualquiera A,€ A y por 
unos vectores linealmente independientes 0, ..., 0, del espacio 
vectorial L(A), se llama base de referencia (hablando con más pre- 
cisión, base de referencia n-dimensional) de A. El punto A, se llama 
origen de la base de referencia. Está claro que a toda base 
(Am A, --., An) le corresponde la base de referencia (Ay A,A» ++.» 

, AJA) y que a toda base de referencia (Aj, Uy, -- +, 0) le cor- 
responde la base (A, AUi ---., AjUn). Por esta razón no se hace 
frecuentemente diferencia entre los conceptos de base y de base de 
referencia. peen A, 

Fijemos en el espacio A una base de referencia R=(0, DA;, ..., DA.) 
que será llamada base de referencia coordenada. Para todo X € Ñ, su 
radio vector OX puede ser representado entonces univocamente en 
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la forma ESA Pie 
OX =Ẹ-0A, +... +8"-0A, (EEK). (1 

Los números E, ..., E” se llaman coordenadas del punto X en 
la base de referencia R (o en la base (O, A,, ..., A,)) y la fila 
E=(E, ..., E") se lama fila coordenada del punto X en la base 
de referencia señalada. Estas coordenadas se llaman a veces coorde- 
nadas afines, Al cambiar la base de referencia coordenada (incluso, 
por ejemplo, al cambiar el orden en el que siguen los vectores), 
cambia también la fila coordenada del punto. La ley de variación 
será considerada más tarde, en el p. 30.4. 

Sean Xe, X, y X, unos puntos arbitrarios del espacio, Se dice 
le al par de puntos (Xe, X,) según la razón A 
(EK), si XX, =AX,X,. De aqui se deduce, en particular, que si 
el punto X, divide al’ par de puntos (X,, X,) según una razón 
determinada, los tres puntos se hallan sobre una misma recta. 
Recíprocamente, si los puntos X,, X,, X, se hallan sobre una misma 
recta y X, * X,, el punto X, divide indudablemente al par (X., X,) 
según la razón A=X,X,: X,X,, ya que los vectores X,X, y X,X, 
deten ser linealmente dependientes. 

¿Cómo ' determinar — dados el número A»€K y las cuordenadas 
(Eh... ED) y (El, ..., El) de los puntos X, y X,—las coorde- 
nadas (El, . . ., $f) del punto X, que divide al par (X,, X,) según la 
razón À? Tenemos, por hipótesis, 


OX =4-0A +... +ENDA, (i=0, 1,2), 


de donde 
XK iOi, 0% =(E E): DA, + + (Ea —E0)-DA,, 
De la relación X,X,=AX_X, resulta 
H—U=ME—E) 


u= Hti Ud ici 


Está claro que el número dado A debe ser diferente de —1, ya 


que en el caso contrario de X,X, = —X,X, se tiene X,= X, To- 
mando A=1, obtenemos las fórmulas 


a a. 


y por ello 


para las coordenadas del punto medio X, del par (X, X,). 
Veamos ahora cómo se refleja la independencia lineal de unos 
puntos arbitrarios X,, ..., X, del espacio A en las filas coorde- 
nadas de los mismos. Sea 
OX; =4- 0A, +... +E OA, (l=1,..., 8), D 
de modo que (E, ..., E) es la fila coordenada del punto X; en la 
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base de referencia escogida. La independencia lineat de estos puntos 
equivale, por definición, a la independencia lineal de los vectores 
X, X, ---. X¡X;. Tenemos de la igualdad (2) 
XX =0X, 0% = &!— 4) UA, +... + ED DA 

es decir, la fila @—ēi, ..., EN—E%) es la fila coordenada del 
vector X; X, en la base OA,, ..., JAn. Por esto el número máximo 
de puntos linealmente independientes del sistema Xy, ..., Xg que 
se obtiene agregando la unidad al número máximo de vectores 
linealmente independientes del sistema X,X,, -.., X,X;, es igual a 


EE EP 
14 rango E . =1-+rango [18/—Elll- 


O 


Es fácil ver que 

LE... Em 
UE ERE a 

1+rango | +++ +++ [=rango e | 
EE UE a 

Efectivamente, restando de la segunda fila, 


fila de la matriz del segundo miembro su primera fila, no alteramos 
su rango y, por ello, 


LE. E na 
IBak 0E—E e 
rango | .... |=ramgo0l ......-.- 


¡Bs E ONE... EE 
=1+ rango 118/—EL 
que es lo que se queria demostrar. 

Sea (Ẹ', ..., E”) la fila coordenada de un punto X. Con frecuen- 
cia la fila (1, E» -.., 59 suele llamarse entonces fila coordenada 
ampliada del punto X. El resultado que hemos obtenido puede ser 
expresado ahora en los términos siguientes: el número máximo de 
puntos linealmente independientes en el sistema Xy, ..., X, es igual 
al rango de la matriz formada por las filas coordenadas ampliadas 
de los puntos de este sistema. 


En particular, para que los puntos Xy, .-., Xm Xns, de un espa- 
cio afín de n dimensiones sean linealmente independientes es necesario 
y suficiente que 

1E 

HE 


loo 


* =o, 1) 
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donde El, 
n+l). 

El determinante que figura en (3) a la izquierda del signo y£ se 
liama a veces determinante volumen del sistema de puntos X,, ... 
~- -> Xna: Su anulación significa que los puntos Xy, ..., Xas, Se 
hallan sobre un mismo híperplano del espacio Y. 

Hemos introducido en el p. 29.4 el concepto de una funcional 
lineal f (X) en un espacio afín A. Veamos cómo pueden expresarse 
los valores de esta funcional en términos de las coordenadas del 
punto X. Sea (El, ..., E") la fila coordenada de un punto X en 


& son las coordenadas del punto X, (i=l,..., 


una base de referencia R=(0, OA,, ..., 04,). De (1) y de la 
relación que caracteriza la linealidad de } (X) obtenemos entonces 


FN =a +... +05" +0 (4) 
donde a =f(4A)—F(0) y a =f(0) son unos números fijos que 
dependen solamente de la funcional f y de la base de referencia R. 
Viceversa, tomando unos números %, œ, ..., %EK totalmente 
arbitrarios y definiendo la funcional f mediante la fórmula (4), po- 
demos comprobar fácilmente que f es lineal sobre A. 

Se dice que el polinomio aE'+...+0,E"-+0, en las variables 
El, ..., Él representa la funcional f en la base de referencia R. De 
lo expuesto se ve que la correspondencia entre los polinomios li- 
neales en n variables E, ..., E" y las funcionales lineales sobre A 
es biyectiva; además, si la funcional f está representada por el po- 
linomio abl+...-+0)E"+a) y la funcional g por el polinomio 
BE+...+B,5"+ By se tiene 


NO A) a Aa + Ba) E + o (5) 


En otras palabras, poniendo en correspondencia a toda funcional 
lineal sobre YX el polinomio en E!, ..., E" que la representa, ohte- 
nemos una aplicación isomorja del espacio vectorial Y, de todas 
las funcionales lineales, definidas sobre Y, sobre el espacio vectorial 
de todos los polinomios lineales (no homogéneos) en El, ... E” con 
coeficientes del cuerpo conmutativo principal K. 

De (5) se ve que las operaciones de adición de las funcionales 
lineales y de multiplicación de las mismas por un número se redu- 
cen a las operaciones correspondientes con las filas de coeficientes 
de los polinomios lineales. De aquí deducimos, en particular, que 
el número máximo de funcionales lineales linealmente independien- 
tes, contenidas en el sistema f, (X), ..., f(X), es igual al rango 
de la matriz formada por los coeficientes de las formas lineales que 
representan a las funcionales señaladas. 


30.2. Ecuaciones de planos. Aceptaremos que en un espacio A 
de n dimensiones sobre un Cuerpo conmutativo K se ha fijado una 
base de referencia R=(0, OÅ, ..., 0A,) y en lo sucesivo enten- 
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deremos por coordenadas de los puntos de A las coordenadas de 
éstos en la base de referencia R. 

Sea PE, 
arbitrarios El, - 


Sea [(E!, ..., E”) una función que está definida sobre K y toma 
valores en K. La condición de tipo 
FE... E9=0 (1) 
se llama ecuación en las variables El, ..., E” y la conjunción de 
las ecuaciones 
EE, ...,E9=0 ((=1,2 .... 5) (2) 
se llama sistema de ecuaciones en las variables El, ..., E”. Si el 


sistema de ecuaciones (2) define en el espacio A un conjunto W, 
se dice también que (2) es el sistema de ecuaciones para el conju 
to M. El conjunto M de puntos definido por el sistema de ecua: 
ones (2) es, según la observación hecha anteriormente, la intersección 
de los conjuntos definidos por cada una de las ecuaciones del sis- 
tema (2) por separado. 

En un cuerpo conmutativo arbitrario la condición aß =0 equi- 
vale a la disjunción a=0 o P=0. Por esto, si las ecuaciones 


HE, 0. EY=0 y gE ..., 89=0 


definen (por separado) en el espacio A los conjuntos respectivos Wt 
y R, la ecuación 
ER DEE, E9=0 . (3) 
define en A la unión de los conjuntos M y N. 
Un conjunto W de puntos de un espacio afín A se llama hiper- 
superficie algebraica, si existe un polinomio f(Ẹ', ..., E”) en las 
variables El, ..., E” con coeficientes del cuerpo conmutativo K tal 
que W se define por la ecuación (1). 
El grado del polinomio f respecto al conjunto de las variables 
El, ..., E" se Ilama grado de la hipersuperficie W. Puesto que un 
mismo conjunto Wt puede tener varias ecuaciones diferentes, una 
misma hipersuperficie algebraica puede tener diferentes grados. Es 
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fácil darse cuenta, en particular, de que si una hipersuperficie tiene 
el grado n, cualquier número mayor también es grado de ella. El 
menor de los grados de una hipersuperficie algebraica dada se llama 
orden de la misma. 

Como el grado de un producto de polinomios es igual a la suma 
de los grados de los factores, de la fórmula (3) se deduce que la 
unión de unas hipersuperficies algebraicas de ordenes s y £ es de 
nuevo una superficie algebraica de orden no anvor que s+ t. 

Se dice que una hipersuperficie algebraica Wt se pde 
si es la unión de dos hipersuperficies algebraicas no vacías diferen- 
tes de la dada. 

La intersección de un número finito de hipersuperficies alge- 
braicas se llama variedad algebraica. 

Los conceptos de hipersuperficie algebraica y de su orden han 
sido definidos mediante el tipo de las ecuaciones a las que satis- 
facen las coordenadas de un punto arbitrario de la hipersuperficie. 
Al cambiar la base de referencia coordenada, también cambiarán 
las coordenadas del punto y con ellas las ecuaciones del conjunto 
considerado. En lugar de hipersuperficie algebraica de orden s, sería 
más correcto hablar por esto de una hipersuperficie algebraica de 
orden s en una base de referencia coordenada dada y, análogamente, 
de la descomposición en la base de referencia coordenada dada, etc. 
Sin embargo, demostraremos en adelante que la propiedad de un 
conjunto de ser una hipersuperficie algebraica de un orden dado no 
depende, de hecho, de la selección de la base de referencia coor- 
denada. 

Las propiedades de las variedades algebraicas arbitrarias cons- 
tituyen el tema de estudio de una asignatura especial, la Geome- 
tría algebraica. En este libro serán estudiadas solamente las hiper- 
superficies de primer orden (los hiperplanos) y sus intersecciones 
(los planos). 

Es poco cómodo que las definiciones de algebraicidad y de orden 
dependan, como hemos señalado, de la selección de la base de re- 
ferencia coordenada. Para deshacerse de esta dependencia se emplea 
el siguiente procedimiento. Sea f(X) una funcional dada en un es- 
pacio afín A de dimensión n. Escojamos en A una base de referencia 
coordenada cualquiera R=(0, OA,, ..., OA,) y pongamos en co- 
rrespondencia a toda sucesión £t, ..., E” de números de K el número 
F(E%, ..., E”) igual a f(X), donde X es el punto de coordenadas 
El, ..., E”. Resulta así que a toda funcional se le pone en corres- 
pondencia una función en n variables a... En que representa 
a la funcional f en la base de referencia coordenada dada R. Reci- 
procamente, definiendo para la función f(t, ..., E") la funcional 
F(X) mediante la igualdad 


POOSIS 0 E), 
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vemos que cualquier función en n variables representa a una fun- 
cional en la base de referencia señalada. Está claro que la variedad 
radical de la funcional f(X), compuesta de aquellos puntos X € YU 
ara los cuales [(X)=0, coincide con el conjunto que la ecuación 
(El, ..., E")=0 define en la base de referencia ccordenada dada. 
Sin embargo, en la definición del concepto de una fincional y de 
su variedad radical no figuran las bases de referencia coordenadas 
y, por ello, es preferible representar las ecuaciones de un conjunto 
de puntos en la forma f(X)=0, donde f es una funcional. ¿Cómo 
entonces caracterizar aquellas funcionales cuyos valores se represen- 
tan por polinomios? La respuesta es la siguiente. Hemos visto ya 
en el p. 30.1 que los polinomios lineales representan a las funcio- 
nales lineales. Consideremos ahora las funcionales F(X,, ..., Xy) 
en s puntos variables. Una funcional F (X,, ..... X,) se Mama lineal 
respecto al i-ésimo argumento X;, si se convierte en una funcional 
lineal en X; para cualesquiera valores fijos de las restantes va- 
riables. Una funcional F (X, ..., X,) se llama polilineal si es lineal 
respecto a cada uno de sus argumentos. Hemos llegado ahora al 
momento central: una funcional f(X) en una variable X se llama 
funcional (o forma) de orden s (o de grado s), si existe una funcio- 
nal polilineal F(X,, ..., X,) en s variables tal que 


HX)=F(X, ..., X). 


Se comprueba fácilmente que habiendo sido fijada una base de 
referencia coordenada cualquiera, la funcional f(X) es de orden s 
cuando, y sólo cuando, sus valores se representan por un polinomio 
adecuado de orden s en las coordenadas del punto X. La demos- 
tración la omitimos aquí debido a su evidencia. 

Después de estas consideraciones generales pasamos ahora al 
problema principal de este parágrafo que es el estudio de las ecua- 
ciones de los planos. 

Supongamos, pues, que en un espacio afín dado de dimensión 
finita n se ha fijado una base de referencia coordenada arbitraria 


R=(0, DA, ..., OA,). Una ecuación de primer grado en las va- 


ríables El, ..., E” es una ecuación de tipo 
a. ab" =p, (4) 
donde al menos uno de los coeficientes a, ..., a, es diferente de 


cero. Introduciendo la funcional 

FO) =a +... +05" —P, 
vemos que el conjunto de puntos M representado por la ecuación 
(4) es la variedad radical de la funcional f(X). La funcional f (X) 
es, según el p. 30.1, lineal y no es constante, de modo que Dè es 
un hiperplano en A. Luego, una ecuación lineal arbitraria en unas 
variables El, ..., E" representa un hiperplano en un espacio afín. 
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Consideremos un sistema cualquiera de ecuaciones lineales 
atatt oE" p 
AE CA (6) 
A o. o aE" = p. 

Indicando por M, el conjunto de los puntos cuyas coordenadas 
satisfacen la ¡-ésima ecuación de (5), vemos que el sistema de ecua- 
ciones (5) define la intersección de hiperplanos M=M,N... NM. 
Según el p. 29.2, esta intersección o bien es vacía o bien es un 
plano cuya codimensión no pasa de s, de modo que la dimensión 
de Mi es no menor que n—s. ¿Cuál es el valor exacto de la dimen- 
sión de WM? 

Introduzcamos las funcionales lineales 


EX) =a +. ae (ist, ..., 5). 


El plano M es la variedad radical del sistema de estas funcio- 
nales. Si MØ, la dimensión de M es igual, por lo visto en el 
teorema 2 del p. 29,4, al número máximo de funcionales Jineal- 
mente independientes en el sistema f,, ..., fs, es decir (véase el 

. 29.4), la dimensión de Mi es igual al rango de la matriz EAI 
Firmada por los coeficientes de las variables del sistema de ecua- 
ciones (5). 

Resta aclarar en qué caso M=Ø y en qué caso Mak Ø, es 
decir, bajo qué condiciones el sistema (5) es compatible, Pero la 
respuesta a esta última pregunta viene dada por el teorema de 


Kronecker—Capelli (véase el p. 5.3): para que el sistema de ecua- 
ciones (5) sea compatible es necesario y suficiente que el rango 
de la matriz principal de este sistema coincida con el rango de su 
matriz ampliada. Hemos obtenido de esta forma el teorema siguiente: 

TEOREMA. En un espacio afin U de n dimensiones todo plano 
(n-—r)-dimensional (0<r<n) M puede ser representado, en cual- 
quier base de referencia coordenada, por un sistema de ecuaciones 
de tipo 


aa =P (i=l, ..., 1) (6) 


tal que el rango de la matriz principal |æ] es igual a r. Un 
sistema arbitrario de ecuaciones lineales de tipo (4) representa en Y 
un plano (n—r)-dimensional siempre que los rangos de las matrices 
principal y ampliada del sistema (4) coincidan y sean iguales a r. 
En cambio, si dichos rangos son diferentes, el sistema (4) es incom- 
patible y, por consiguiente, representa el plano vacio. 

Consideremos el problema siguiente, Dadas las filas coordenadas 
(Bl, ..., BI) de unos puntos B; (¿=0, 1, ..., s) de un espacio A, 
hallar la ecuación del plano mínimo Wt = B, V B, Y ... V B, que pasa 
por los puntos dados. 
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Resolvámoslo primero en la forma vectorial. El plano Wi se com- 


pone, según el p. 29.2, de los puntos X € A tales que el vector B,X 
puede ser representado en la forma 


BX=MB,B,+...+hBiB, (a aes AEK), 
es decir, 
OX = 4, (0B, —0B,) +... +, (0B, —0B,) + 0Bo. (7 
La ecuación (7) se Hama a veces ecuación de un plano en la 
forma vectorial paramétrica. Introduciendo aquí en lugar de los 
radios vectores OX y OB, sus filas coordenadas correspondientes, 
obtenemos las relaciones 
E=(PMPDA + AH PB HB (i=l, ...,. 2. (8) 
Poniendo Pi— Pi =y}, podemos representar estas relaciones en 


la forma 
ESPA RAYA IB =l, ..., n), (9) 


que expresa las coordenadas de un punto arbitrario XEM en tér- 
minos de los parámetros independientes auxiliares Ay, ..., Ay. Las 
ecuaciones (9) se llaman ecuaciones coordenadas paramétricas del 
plano Wt. Puesto que M =B, V B, V --- VB, la dimensión de W 
es igual al número máximo de puntos linealmente independientes 


ue figuran en el sistema B,, B,, ..., B, disminuido en 1, es 
lecir, es igual al rango de. la matriz C= ]|yjl] formada por los 
coeficientes de las variables A,, ..., As de las ecuaciones paramé- 
tricas. 


Para obtener de las ecuaciones paramétricas (9) de un plano W 
sus ecuaciones generales de tipo (5), es suficiente eliminar del 
sistema (9) los parámetros A, ..., As. Esto se puede hacer, por 
ejemplo, del modo siguiente, Buscamos el rango de la matriz ii ; 
Supongamos que éste es igual a r; luego, entre las ecuaciones (9) 
existen unas ecuaciones ñ-ésima, iyésima, ..., )yésima y entre 
los parámetros ^, ... A, existen unos parámetros Aj, ..., Ay, 
(iKa <ii h <- <h) tales que det [|yíg[|=20. Resolviendo 
estas ecuaciones respecto a las incógnitas Àj, ..., Àj, obtendre- 
mos para éstas unas expresiones lineales en términos de E, ..., En 
y de los restantes parámetros A; (IÈ {j ..., ¡pp). Introduzcamos 
ahora los valores obtenidos de los parámetros en cada una de las 
ecuaciones restantes del sistema (9). Obtendremos asi unas relacio- 
nes lineales entre las variables É,, ..., E, y los parámetros Ay, 


matriz | 
ciones de tipo (5) que representarán el plano M. 
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En los razonamientos realizados hemos supuesto que 0&7 < n. 
Si r=n, el plano Wè pasará por n+1 puntos linealmente indepen- 
dientes y coincidirá con todo el espacio A; si se quiere, su ecua- 
ción general» puede ser representada en la forma 


0-E4+...+0.5=0. (10) 


Consideremos el problema recíproco: ¿cómo hallar las ecuaciones 
paramétricas de un plano M dado por unas ecuaciones generales 
de tipo (5)? Supongamos que la dimensión de Mes z <n. El 
sistema (5) contiene entonces sólo r ecuaciones independientes y los 
coeficientes que tienen en estas ecuaciones unas r variables forman 
una matriz de determinante diferente de 0. Supongamos, para conc- 
retar, que son independientes las r primeras ecuaciones y que es 
diferente de cero el determinante formado por los coeficientes de 
las variables El, E'. Resolviendo las r primeras ecuaciones 
respecto a las variables E*, ..., E”, obtendremos entonces un sistema 
de ecuaciones de tipo 


ESMAS (im, 1) UN) 


equivalente al sistema (9). Está claro que el sistema (11) es equi- 
valente a las ecuaciones paramétricas 


a td E a r) 
sha, (i=r+l, .... 5). 


Hemos considerado detalladamente el problema de la determi- 
nación de las ecuaciones del plano mínimo que pasa por los puntos 
dados. Está claro que dicho problema representa un caso particular 
de un problema más general sobre la determinación del plano 
mínimo que pasa por los planos dados M y N. Sin embargo, este 
problema más general puede ser reducido de un modo formal al 
primer problema. En efecto, los planos M y N pueden ser repre- 
sentados en la forma + 


M=B,VB,V... VB, (dimM=5), 
N=C,V CV... VC, (dimNR=1), 


donde Bo, B,, ..., B, son unos puntos linealmente independientes 
de W y Co Ci, . ., Ci son unos puntos linealmente independien - 
tes de M. Entonces 


MVNR=B,V ... V Bi VCs V.. V Ci 


y el problema ha quedado reducido a la determinación del plano 
mínimo que pasa por los puntos Bj, ..., By, Cos ..., Cie ¿Cómo 
determinar los puntos B, ..., B, si el plano W viene dado por 
sus ecuaciones generales de tipo (5)? Uno de los métodos (que no 
es el más breve) es el siguiente. Reducimos el sistema (5) a ia 


362 Cap. VIII. Espacios afines 


forma (11). Indudablemente podemos tomar entonces para los pun- 
tos B, los puntos de las filas coordenadas siguientes 


(B)=(P, p, a Mero: 


A (BH Yh A A O 
E oo BHY 0, 1... O) 
Gaei BE o PAv 0, 0 oa D 


(s+r=n). 


Consideremos otro problema particular. Supongamos que en un 
espacio 2 se ha escogido una base de referencia coordenada 


R=(0,04,, ..., OA). Los planos de tipo OV Ai, V... V An 


(1<i<... <i, <n) se llaman entonces planos coordenados r-di- 
mensionales. Poniendo 


BO0VAV ... V Ataa V Ari V +. V Am (12) 
vemos que R, Q, Sp, son todos los hiperplanos coordenados 


posibles. De (13) resulta que bn punto X de coordenadas (E, 
pertenece a $, cuando, y sólo cuando, 


El=0, (13) 

En otras palabras, la ecuación (13) es la ecuación del hiperplano 
P, El plano coordenado O V Az, Y... V A, =M es la intersección 
de todos los hiperplanos PB, que tienen el índice diferente de 


Íi, +++» Em Por esto las ecuaciones del plano M pueden ser repre- 
sentadas en la formà 


E=P=...=E20, 

y es la sucesión de aquellos números naturales 
del conjunto 1, 2, ..., n que no figuran en el conjunto fi, ..., 1,). 
Por ejemplo, Jas ecuaciones del i-ésimo eje coordenado O Y A, 
pueden ser representadas en la forma 

Po. mp mp pnm, 

A titulo de ilustración consideremos el siguiente ejemplo numé- 
rico. En el espacio afín R°? corriente real de tres dimensiones está 
dada mediante dos ecuaciones 

P+ P=l, ) 
422 =2 
una variedad lineal M. 
¿Cuál es la dimensión de M? Componiendo la matriz ampliada 


de este sistema 
12-11 
12-22j* 


donde a, B, 


(14) 
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vemos que contiene un dete: ante de segundo orden diferente 
de cero, cuyos elementos están indicados con las cifras gruesas. 
Es más, este determinante pertenece a la matriz principal del sis- 
tema. Por esto el rango de la matriz ampliada, que es igual a dos, 
coincide con el rango de la matriz principal. De aquí sacamos la 
conclusión de que la codimensión de Wi es igual a 2 y de que la 
dimensión de W es igual a 1, es decir, M es una recta. 

Resolviendo el sistema (14) respecto a El y °, encontramos 

=l, 
E=-—2. 

Podemos aceptar aquí que E? es un parámetro, de modo que (15) 
puede ser considerado como las ecuaciones paramétricas de la 
recta Wt. Dando al parámetro $° los valores O y 1, obtenemos 
de (15) que los puntos de coordenadas (0, 0, —1) y (2, 1, —1) 
se hallan sobre la recta W. 

Consideremos otro ejemplo. ¿Qué conjuntos de puntos del espa- 
cio R” son representados por las ecuaciones 

a) EEE = 0, 

b) EPIA — E 4 E = 0? 

Está claro que en el caso a) el conjunto incógnito es la colec- 
ción de los tres hiperplanos coordenados de ecuaciones 1) Et=0, 
2) E*=0 y 3) E*=0. En el caso b), el primer miembro se descom- 
pone en los factores El+-1 y El—E*-+E* y, por ello, el conjunto 
incógnito es la colección de los hipérplanos de ecuaciones E*+1=0 
y pE +E =O. 


30.3. Ecuaciones de hiperplanos y de rectas. Queremos exami- 


nar aqui más detalladamente las ecuaciones de los fiiperplanos y de 
las rectas, así como las condiciones de paralelismo de los mismos, 
expresadas en la forma coordenada. 

TEOREMA 1. Todo hiperplano de un espacio afin de n dimensiones 
puede ser representado mediante una ecuación de primer grado 


ape. atao =O. (0) 


Para que un hiperplano representado por la ecuación (1) coincida 
con un hiperplano representado por la ecuación 


BE+--.+B,"+Bo=0, 12) 


es necesario y suficiente que sean proporcionales los coeficientes co- 
rrespondientes: 


(15) 


=... =f. (3) 


Los hiperplanos representados por las ecuaciones (1) y (2) 
son paralelos cúando, y sólo cuando, sús respectivos coeficientes 
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principales son proporcionales: 


, (4) 


El teorema contiene tres afirmaciones. La primera ha sido ya 
demostrada en el p. 30.2. Para que los hiperplanos (1) y (2) coin- 
cidan es necesario y suficiente que el conjunto de las ecuaciones 
(1) y (2) defina un hiperplano. Esto equivale, según el teorema 
del p. 30.2, a que 


ls: A 
a AA AT la 


y esto significa precisamente que tiene lugar (3). 

Los hiperplanos (1) y (2) son paralelos, si coinciden, y enton- 
ces tenemos (3), o si no se intersecan. En el último caso las ecua- 
ciones (1) y (2) deben ser incompatibles y por esto, según el teorema 
de Kronecker—Capelli, se tiene 

rango [% - 5]=1 
dl ROA 
es decir, se tiene (4). Luego, la condición (4) es verídica en ambos 
casos, 

Consideremos el problema: dada la ecuación (1) de un hiperplano $ 
y las coordenadas El, ..., ES de un punto A, hallar la ecuación del 
hiperplano que es paralelo a SB y que pasa por el punto A. 

Sea (2) la ecuación del hiperplano $” que buscamos. Puesto 
que este hiperplano es paralelo al hiperplano (1), deben cumplirse 
las condiciones (4). Por esto multiplicando la ecuación (2) por un 


coeficiente de proporcionalidad adecuado, podemos representar la 
ecuación del hiperplano que buscamos $3” en la forma 


ae... +0." +B9=0. (5) 
El punto A se halle, por hipotesis, sobre Y”. Por ello 
abit... +0 534 Be = 0. (6) 


Restando de (5) término por término (6), obtenemos la ecuación 


deseada 
a (El) + >. H an E7 E0) =0. 


Está claro que el hiperplano definido por la ecuación (1) pasa 
por el origen (0, ..., 0) de la base de referencia coordenada cuando, 
y sólo cuando, a, =0. Consideremos el caso en que a, 50. Divi- 
diendo por —«, todos los coeficientes de la ecuación (1), podemos 
reducirla a la forma 


E E 
AE m 
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Los números y, ..-, Ya admiten una interpretación geométrica 
simple. Efectivamente, busquemos el punto de intersección del 
hiperplano (7) y del eje coordenado OV A;. Las ecuaciones de este 


FERIA Ber. =P. T 68) 


Resolviendo conjuntamente (7) y (8), obtenemos =y; Por 
consiguiente, el hiperplano (7) intercepta en el eje OVA; el vec- 
tor y/0A;. Por esta razón la ecuación (7) suele llamarse general- 
mente ecuación segmentaria de un hiperplano. 

Examinemos también el siguiente problema: ¿bajo qué condicio- 
nes la ecuación (1) representa un hiperplano que pasa por el plano 
coordenado OW A/V... VA, (L<r <n)? Este plano esta formado 
por los puntos de coordenadas (El, .=., E”, 0, «.., 0). Introduciendo 
estas coordenadas en la ecuación (1), obtenemos +... -+ a," + 
+a,=0. Esta relación debe satisfacerse para lea valores 
de los números El, ..., E” del cuerpo conmutativo K. Por consi- 
guiente, a, =... =0,==0,==0. Análogamente se comprueba que el 
Ñiperplano (1) pasa porel plano coordenado r-dimensional OV Ar, V « 
+... VAn cuando, y sólo cuando, œu, -=04,=0)=0, 

Manteniendo invariables en la cotación (1) los coeficientes prin- 
cipales %,, ..., %, y dando diferentes valores al término indepen- 
diente œ, obtenemos ecuaciones de hiperplanos paralelos. Por esto, 
si en la ecuación (1) se tiene ou, = 21, =0, mientras que el 
término independiente a, es arbitrario, el hiperplano (1) es paralelo 
al plano coordenado OV A,,V . . . V A. En particular, el hiperplano (1) 
es paralelo al eje coordenado OV A; cuando, y sólo cuando, «,=0, 
es decir, cuando la ecuación (1) no contiene explícitamente la 
i-ésima coordenada. 

Como sabemos, por cualesquiera n, puntos linealmente indepen- 
dientes Bj, ..., Ba de un espacio afín de n dimensiones pasa un 
hiperplano B,V... VB, y sólo uno. ¿Cómo escribir la ecuación de 
este hiperplano, “si se conocen las filas coordenadas de los puntos 
Bi ..., Br? Supongamos que (Bi, ..., BI), ~.. (Bhs +... Ba) son 
las filas coordenadas de los puntos ++ By. Para que un punto 
arbitrario X de coordenadas £t, ..., E se halle sobre el hiperplano 

B,V... VB, es necesario y suficiente que el sistema de puntos 
X, B., ..., B, sea linealmente dependiente. Según el p. 30.1, el 
sistema de puntos señalado será linealmente dependiente cuando, 
y sólo cuando, las coordenadas de estos puntos satisfacen la condi- 
ción 


(9 
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Desarrollando el determinante según los elementos de la primera 
fila, vemos que la ecuación (9) es lineal respecto a las variables 
El, ..., E” y, por ello, representa el plano deseado. 

El ermino independiente de la ecuación (9) es igual a det ||). 
Por consiguiente, el hiperplano que pasa por los puntos linealmente 
independientes B, ..., B. pasará por el origen de coordenadas 
cuando, y sólo cuando, det || Bo. 

Consideremos ahora más detalladamente las ecuaciones de las 
rectas. Supongamos dado en un espacio afín A de n dimensiones 
un par de puntos diferentes B, (Bb, ..., B3) y B, (Bl, 
se indican entre paréntesis las coo! os € 
base de referencia coordenada fija R=(0, UA, ..., 04). El 
punto X pertenece a la recta B, VB, cuando, y sólo cuando, existe un 


número 4 tal que B,X =XB,B,, es decir, cuando 
gip =A (P — pi) i=l, ..., n). (10) 


Determinando À de cada una de las ecuaciones (10) e igualando 
los resultados, obtenemos 


PA ai) 
Bi— po `  BE—Bo 
Recíprocamente, siendo Ẹ?, ..., E” las coordenadas de un punto X 


ue satisfacen las igualdades (11) e indicando por A el valor común 
de las razones (11), obtenemos (10), de modo que X € B,VB,. Por 
consiguiente, las ecuaciones (11) son las ecuaciones de la recta que 
pasa por dos puntos dados. 

Notemos que en las razones (11) algunos de los denominadores 
pueden anularse, Puesto que queremos que las relaciones (11) sean 
equivalentes a las condiciones (10), debemos tomar §'— B$ = Ô siempre 
que Pi — Pi 

Poniendo B¡—P¿=pu' y BI =P? podemos representar las ecuacio- 
nes (11) en la forma 


E E (12) 


Los números pl, ..., u” se llaman coeficientes directores de la 
recta y las ecuaciones (12) se llaman ecuaciones de la recta en coe- 
ficientes directores. 

TEOREMA 2. Para que la recta (12) sea paralela a la recta 


(13) 


es necesario y suficiente que sus coeficientes directe -es sean propor- 
cionales; 
E A (14) 
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Las rectas (12) y (13) coinciden cuando, y sólo cuando, se cum- 
plen las condiciones de proporcionalidad (14) y las condiciones 


que significan que el punto de coordenadas PY, ..., B” que perte- 
nece a la recta (12) se halle sobre la recta (13). 

De las ecuaciones (12) se ve que los puntos B,(B', ..., B") 
y B,(B'+u', ..., B*-+p2) se hallan sobre la recta que representan 
estas ecuaciones. 'Análogamente, sobre la recta (13) se hallan los 
untos Ce (Y, ..., V") y Cu(p.+v, ..., y"). Según el p. 29,3, 
as rectas B,VB, y C,VC, son paralelas cuando, y sólo cuando, 


se tenga C,C,=1B,B, para un AEK, es decir, cuando las coorde- 
nadas de los vectores B,B, y C,C, sean proporcionales. Puesto que 
las coordenadas de estos vectores son iguales, respectivamente, 
a ph ..., pr y vi, ..., V”, obtenemos de aquí (14). Como para 
la coincidencia de las rectas es suficiente que tengan un punto 
común y que sean paralelas, la segunda afirmación del teorema 2 
se desprende directamente de la primera afirmación. 

Además de las ecuaciones de tipo (13), una recta en un espacio 
afin de n dimensiones puede ser definida también mediante un 
sistema general de ecuaciones lineales de tipo 


a pata =0 (il, ..., s) (15) 


donde los rangos de la matriz principal y de la ampliada son iguales 
a n—1, ¿Cómo conociendo las ecuaciones de una recta en la forma 
general (15) hallar sus ecuaciones en la forma canónica (13)? Para 
ello es suficiente hallar las coordenadas de dos cualesquiera puntos 
diferentes de la recta (15) y recurrir después a la fórmula (11); 
pero se puede proceder también del modo siguiente. El rango del 
sistema (15) es, por hipótesis, igual a n—1. Luego, n—1 coorde- 
nadas variables, digamos §t, E”-1, pueden ser expresadas me- 
diante la restante coordenada variable E”. Así obtenemos unas 
expresiones de tipo 


Esp Bl (i=l, .... n—I), 


de donde 
ELL p 
FG e EOR i, 
Estas serán precisamente las ecuaciones eanónicas de la recta (15). 
Para concluir determinemos las condiciones de paralelismo de 
una recta y de un hiperplano en la forma eoordenada. 
TEOREMA 3. Un hiperplano dado mediante la ecuación 


at... HaHa =0 (16) 
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es paralelo a una recta dada mediante las ecuaciones 
A a a7 


cuando, y sólo cuando, 


apt... Hap. (18) 

Indicando por A el valor común de las razones de (17), obte- 
nemos i 

=p p (i=l, ... n) (19) 


Introduciendo en (16) estos valores en lugar de las coordenadas 
variables El, llegamos a la ecuación 


(af Hanh") a (aB n a+ a). (20) 


Si resulta que a,pt+...-+Quk” 30, encontraremos primero de 
(20) un valor único para A y, después, de (19) unos valores, tam- 
bién únicos, para las coordenadas E' del punto de intersección de 
la recta (17) y del hiperplano (16). Por consiguiente, en este caso 
la recta y el hiperplano son, sin duda alguna, no paralelos. 

Sea a+... + af = 0. Si el segundo miembro de (20) es dife- 
rente de cero, la ecuación (20) no tiene soluciones para A, la recta 
(7) y el hiperplano (16) no se cortan de po ello, son paralelos. 

or otra parte, si el segundo miembro de (20) es igual a cero, la 
ecuación (20) se cumple para cualesquiera valores de A, es decir, 
todos Jos puntos de la recta se hallan sobre el hiperplano y, por 
consiguiente, la recta y el hiperplano son de nuevo paralelos. 


30,4. Transformación de coordenadas afines. ¿Cómo varían las 


coordenadas El, ..., E” de un punto arbitrario X de un espacio 
afin Y de n dimensiones, si pasamos de la base de referencia coor- 
denada fija R=(0, OA, ..., OA.) a otra base de referencia 
R'=(0", + OYAr)? Consideremos primero el caso en el 


que la base de referencia R’ se obtiene de la base de referencia R 


mediante una traslación determinada por el vector 00”. En este 
caso se tiene 


23% Mi (1 

Tenemos, por hipótesis, 
OX=E-DA +... +E"- DA. 2) 
Indicando por al, ..., a” las coordenadas del origen nuevo O” 
(en la base de referencia “antigua” R) y por EY, +..., E las 


coordenadas nuevas del punto X (en la base de referencia R'), 
obtenemos 


(3) 
(4 
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Sumando término a término las igualadades (3) y (4), emplean- 
do las relaciones (1) y comparando el resultado obtenido con las fór- 
mulas (2), llegamos a las fórmulas que buscamos 

YSE pal (al, s) 6) 
que representan la ley de transformación de las coordenadas en una 
traslación del origen. 

Consideremos ahora el caso en el que el origen de la base de 
referencia coordenada nueva coincide con el origen de la base de 


referencia antigua. Los sistemas de los vectores coordenados JA, 
o OA, y O .., OA; representan dos bases del espacio 
vectorial L(A), de modo que los vectores coordenados nuevos O'A; 
pueden ser expresados mediante los antiguos por fórmulas de tipo 
DA =)-DA +... +19-ÓA, 

(6) 

li=l, ..., n), 

donde el determinante de la matriz T=||r/¡] es diferente de cero 
(p 


Observando que O=0', introducimos en la fórmula (4) las 
expresiones (6) en Jugar de los vectores OA. Comparando el resul- 
tado de la sustitución con la igualdad (2), 5 
llegamos a las relaciones nA az 
A) o Y ý 
que pueden ser representadas brevemente y, 3 
en la forma matricial conocida 
CO O g 
Finalmente el_paso de una base de 
referencia R=(0, DA,,..., OA,) a otra 
base cualquiera de referencia R’ =(0",07A;, 
-., OA) puede ser realizado en dos pasos (véase la fig. 9 para 
el caso en el que 1=2): 1) trasladamos la base de referencia ini- 
cial en el vector 00”, obteniendo así una base de referencia R* de 
origen en el punto O” y 2) pasamos de la base de referencia R* a 
la base de referencia R’ sin cambiar el origen de coordenadas. 


Empleando sucesivamente las fórmulas (5) y (7), obtenemos las 
relaciones definitivas 


Eh (ES, EU) TE (aL, a), (8) 
donde T'=||*f[] es la matriz del cambio de la base OA, ..., UA; 
por la base 0'A;, ..., O'A, (que está formada por los coeficientes 
de las expresiones lineales de los vectores O'A; en términos de los 
vectores 0. » OA,), (0%, ..., a”) son las coordenadas del 


24—1843 


370 Cap. VIII. Espacios afines 


origen nuevo y (È, ..., $") y Œ”, .... E") son, respectivamente, 
las coordenadas antiguas y nuevas de un punto arbitrario X. 

Por razones puramente formales la fila (1, E, ..., E”) ha sido 
llamada en el p. 30.1 fila coordenada ampliada del punto X siendo 
(El, ..., E") la fila corriente de sus coordenadas. De la fórmula 
(8) se desprende directamente que 


$ (ME (ES, 0.0, ET, (9 
donde 
A i 
A A 
Teef E, ao 
ORT 


La matriz Teg se llama matriz del cambio de la base de refe- 
rencia R por la base de referencia R'. De (10) resulta que el deter- 
minante de la matriz Tgr coincide con el determinante de la 
matriz ia que es la matriz del cambio de la base coordenada 
antigua del espacio vectorial L(2) por la base nueva. Recíproca- 
mente, cualquiera que sea la matriz T, de tipo (10) con el deter- 
minante diferente de cero y cualquiera que sea la base de referen- 
cia R dada de antemano, las fórmulas GH los números œ, ..., a” 
permiten determinar univocamente una base de referencia R’ tal 
que la matriz T, sea la matriz del cambio de R por R’. 

De la fórmula (9) se desprende el siguiente corolario impor- 
tante. 

coroLario. Sean R, R' y R” tres bases arbitrarias de referencia, 
sea Twr la matriz del cambio de R por R' y sea Tr-r la matriz 
del cambio de R’ por R". Entonces la matriz del cambio de R por R° 
será igual al producto Tr-g'Ter. En particular, si Trip es la 
matriz del cambio de la base de referencia R por la base de referen- 
cla R, la matriz del cambio de R' por R es la matriz inversa 
Te 
En efecto, indicando por (E, ..., E), (EU, ..., 81) y 
(E, ..., E") las coordenadas de un punto arbitrario X en las 
bases de referencia R, R' y R', respectivamente, tenemos, 
según (9), 


(15 EE, 0 E) Te 
y, al mismo tiempo, se tiene 
dE =q, El, ..., E%)-Trr= 
(1,8%, ..., EM)-TerTrr. 
Por consiguiente, para cualesquiera El", ..., 87 €K resulta 
MB cs PT E, ataa UIT Tr 
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Tomando aquí para E", ..., E” las coordenadas en la base de 
referencia R” del vértice de esta base de referencia, obtenemos 
Troir =TRRTRR (11) 


Si la base de referencia R” coincide con ia base de referencia 
R', la matriz Treg es, obviamente, Ja matriz unidad y la relación 
(11) se convierte en 

E=TRreT RR, 
de donde resulta 
Tre'r =TRk (12) 


Hasta el momento nos hemos interesado sólo por la ley de va- ' 
riación de las coordenadas de los puntos. Preguntémonos ¿cómo 
varían las ecuaciones de los conjuntos de puntos cuando se pasa 
de una base de referencia coordenada a otra? 

Sea dada una ecuación 


E, E")=0 (13) 


de un conjunto Mi en una base de referencia R. Esto significa, 
por definición, que un punto arbitrario X pertenece a M cuando, 
y sólo cuando, sus coordenadas El, ..., E” satisfaten la relación (13). 
Al pasar a una base de referencia coordenada nueva R’, tenemos 
según (8) 


Eo rta dm. 


Introduciendo en (13) estas expresiones para El, ..., E”, obte- 
nemos 

(QEU... DBEa. (14) 

Puesto que las coordenadas nuevas E", ..., EY de un punto 


arbitrario X satisfacen la relación (14) cuando, y sólo cuando, 
XEM, resulta que (14) es la ecuación que buscamos del conjunto 
M en la base de referencia coordenada nueva. El primer miembro 
de la igualdad (14) es una función g(8", ..., E") de las varia- 
bles El, ..., EY que se distingue, en general, por su forma de la 
función inicial f. Sin embargo, si f es un polinomio de un grado 
s en las variables El, ..., E se ve de (14) que g también será 
un polinomio de grado s en las variables EM, ..., ET. 

Igual que en el caso de los espacios vectoriales (véase el 
p. 5.1), el problema sobre la transformación de las coordenadas 
afines está ligado estrechamente al problema de la determinación 
de todos los automorfismos de un espacio afín A sobre un cuerpo 
conmutativo fijo K. Sea n la dimensión del espacio A y sea 4 un 
automorfismo de A sobre K (véase el p. 29.1). Tomemos en Y una 


TE 
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base de referencia coordenada R=(0, DA,, ..., OA). Sus vérti- 
ces O, Ay, ---, A, forman en A un sistema linealmente indepen- 
diente de puntos. Com la relación de independencia lineal se 
conserva en los automorfismos, los puntos O4, A4, .... Ant 
pueden ser considerados como los vértices de una base de referen- 
cia coordenada nueva RA=(0.4, OAA,A, ..., OAA,A). Indique- 
mos por (X)h, ..., (Xk las coordenadas de un punto arbitrario X 
calculadas en la base de referencia R y sea 
[XJa=(1, (0%, ++ (0%) 
la fila ampliada de coordenadas del punto X en la base de refe- 
rencia R. La fórmula (2) toma entonces la forma siguiente: 
OX =(X)k- DA, +... +(XY4- TAn (15) 

Como los isomorfismos conservan las relaciones de dependencia 

lineal entre vectores, obtenemos de (15) 


TAXA =(X)k DAA A+... +H(XYi: DAA, A. (16) 


En otras palabras, las coordenadas de X.4 en la base de refe- 
rencia RA coinciden con las coordenadas de X en la base de re- 
ferencia R, es decir, en notación abreviada 


SS 
Aplicando la fórmula (9), obtenemos 
Klr=1X4]r4=1X4)T rar 
y por esto, debido a (12), resulta 
(X4]r=[X1T RRA (17) 


La matriz TRga se llama matriz del automorfismo A en la base 


de referencia R y se indica por [4]z o simplemente por [4], si la 
base de referencia R se conoce de antemano. Por esta razón la re- 
lación (17) puede ser representada en la forma definitiva 


[X4] =[X] [4]. (18) 
Sean Æ y B dos automorfismos arbitrarios dados del espacio Y. 
Aplicando la fórmula (18), obtenemos 
[X(48)) = [X] [48], 
NX 0 B) = [XAB] = [X] [4] [8], 
de donde resulta 
(X] [43] = [X144] [8). 
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Puesto que esta igualdad debe cumplirse para cualquier punto X, 
tenemos 


[43] =[4] [8] 
y. por consiguiente, 

[471] =[4]>. 
Consideremos un ejemplo. Sea 4 una traslación de A de vector 
00' de coordenadas al, ..., a” en la base de referencia R= 
= (0, OA,, -.., OA,). De las fórmulas (9) y (5) obtenemos entonces 

Pla — ... —a” 

0 1 0. 0 

HeT ara O] 


0 e 
En cambio, si el automorfismo 4 deja inmóvil el origen de la 


base de referencia coordenada R, la matriz [4] se descompone en 
l y en la matriz [|7)]] del cambio en el espacio vectorial L (A). 


Ejemplos y problemas 


1. Hállense las condiciones necesarias y suficientes de intersección de dos 
sectas dadas por ecuaciones en coeficientes directores. a 

2, Hállense las ecuaciones paramétricas del plano dado por el sistema de 
ecuaciones 


n+ +2 =3, 
n= 145, =-3. 


xt 243 =!, ) 


3. Demuéstrese que todo plano M de un espacio afín es el mismo un espacio 
afín cuya dimensión es igual a la dimensión de M 

4. Demuéstrese que un plano M de un espacio afín diferente de un punto 
es paralelo a cualquier plano que no corte el primero cuando, y sólo cuando, 
AM es un hiperpiano. 
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Hasta el momento no hemos considerado conceptos geométricos 
tan esenciales como son los conceptos de la relación “hallarse entre”, 
de semiplano y de convexidad. La razón de esto estriba en que en 
los espacios afines sobre un cuerpo conmutativo arbitrario estos con- 
ceptos no pueden ser introducidos de un modo natural. Para tra- 
tarlos es necesario limitar la clase de cuerpos conmutativos y pasar 
al estudio de los espacios afines sobre cuerpos conmutativos orde- 
nados, por ejemplo, sobre el cuerpo de los números reales. Las 
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propiedades principales de estos espacios constituyen precisamente 
el tema que se estudia en este parágrafo. 


31.1. Rayos, Recordemos que un cuerpo conmutativo K se llama 


ordenado, si para los elementos de K, además de las operaciones 
de adición y de multiplicación, se introduce también una relación 
de orden < sometida a dos condiciones: 


a<boarr<B+ (1 
0<a y 0<PB>0<0p (2) 
(a, B, VEK). 


El ejemplo más importante de un cuerpo conmutativo ordenado 
es el cuerpo de los números reales que es el que debe tenerse en 
primer orden en cuenta en todos los razonamientos ulteriores de 
este parágrafo y del siguiente. á 

No está de más observar que de (1) y (2) se desprenden direc- 
tamente las sigúientes propiedades: 

Para cualquier elemento a de un cuerpo conmutativo ordenado se 


tiene 
0<a y —e<0 (8) 
y, en particular, 0O<1 y —1<0. 
Para unos elementos arbitrarios a, B y y de un cuerpo conmu- 
tativo ordenado se tiene 
«<p>—P.<—a, (4) 
0<a y B<r>0p<ay. (5) 


Se toma por definición que la relación æ < ß equivale a la con- 
junción a < M azp y que las relaciones a >P y a >p significan 
lo mismo que las relaciones P <a y P < a. El elemento no negativo 
de los elementos a y —«a se llama valor absoluto de a y se indica 
por Ja]. De las relaciones de (1) a (5) se deduce fácilmente que 


I—a[=ja) [a+Bl<lal+1B! y labl=/2/181. 
Consideremos ahora un espacio afín A sobre un cuerpo conmu- 


tativo ordenado K. Se dice que en el espacio afín A el punto X 
se halla entre los puntos A y B, si 


AX=»AB y 0<i<1 AEK). (6) 


Está claro que si X se halla entre A y B, los puntos A, X y B 
se hallan sobre una misma recta. Además, la relación «hallarse entre» 
es simétrica: si X se halla entre A y B, X se halla entre B y A. 
Efectivamente, de (6) obtenemos 


AB=AX 4 XB=1:AB+XB, 
y por esto Sd qn 
BX=(1-M-BA, 0<1—A<1. 
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Sean A, B y C unos puntos, diferentes dos a dos, que se hallan 
sobre una misma recta. Para un valor adecuado 4€ K tenemos en- 
tonces AC =A. AB. El número A satisface a una de las condiciones, 
y sólo a una de ellas: a) à< 0; b) 0O<A<1 y c) 4>1. Es fácil 
comprobar que en el caso a) el punto A se halla entre B y C, que 
dd e) el punto B se halla entre A y C y que en el caso b) el 
punto C se halla, por definición, entre A y B. 

Por consiguiente, de cualesquiera tres puntos que se encuentran 
sobre una misma recta uno, y sólo uno, se halla entre los otros dos. 

Análogamente se comprueba también la segunda propiedad prin- 
cipal de la relación «hallarse entre» si el punto X se halla entre 
los puntos A y B y el punto Y se halla entre A y X, el punto Y 
se halla entre A y B. 

Empleando el concepto «entre», podemos introducir en toda recta 
dos relaciones naturales de orden llamadas también direcciones de 
la recta. Tomemos sobre la recta dada WM dos puntos distintos cua- 
lesquiera A y B e introduzcamos para los puntos de M una relación 
binaria < ag que depende de A y de B tomando, por definición, 
que X <S ¿Y es verídica si 


AX=>AB, AY =p-AB y 1<p A pEK) (0) 
es decir, ordenando los puntos de la recta M según el orden en el que 


se encuentran sus coordenadas en la base de referencia (A, AB). 
Está claro que los órdenes < 4s Y < pa son duales es decir, que 
XS a Y EYS paX- 

Por otra parte, el orden < po definido sobre M mediante otro 
par cualquiera de puntos P, Q coincide con el orden < 4a, Si P < 48Q, 
y coincide con el orden < py si Q<agP. Por consiguiente, entre 
los órdenes de tipo <pg sobre una recta M existen solamente dos 
órdenes diferentes. Estos órdenes se llaman órdenes o direcciones natu- 
rales de la recta. Los automorfismos del espacio Á sobre K con- 
servan la relación «hallarse entre» y también conservan los órdenes 
naturales. Sin embargo, gracias a Ía existencia sobre una recta de 
dos órdenes naturales, los automorfismos del espacio. pueden trans- 
formar un orden natural sobre la recta M en el otro orden natural 
sobre la misma recta. Por esto, es invariante el par de relaciones 
duales de órdenes y no la relación de orden. 

TEOREMA, Sí una funcional lineal f(X) no es constante sobre una 
recta Wt, la aplicación f (X) — X (X EM) es una aplicación biyectiva 
de K sobra Men la que el orden <, definido sobre el cuerpo con- 
mutativo K, se transforma en uno de tos dos órdenes naturales de- 
finidos sobre M. 

Fijemos sobre la recta unos puntos O y A tales que f (0) + f (4) 
y sea 


OX=14-04 (XEM y AEK). 
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La aplicación + — X, es, debido a (7), una aplicación biyectiva de K 
sobre M que transforma el orden dado sobre K en un orden natural 
sobre Mt. De la linealidad de f se deduce que 


100 =2MHA)—HO) +F (0) =h +B. 


Puesto que «=%0, la aplicación f(X) —A es una aplicación 
biyectiva de K sobre K que o bien conserva el orden o bien lo 
invierte. La aplicación f(X)— X, por ser la composición de las 
apio HX) —h y à— X, también es biyectiva y transforma 
el orden sobre K en un orden natural sobre Mi, 

Cualesquiera g sean dos puntos A y B de un espacio A se 
llama segmento [Á, B) el conjunto de todos los puntos que se hallan 
entre A y B. Los puntos A y B se llaman extremos del segmento [A, B]. 
De la definición de la relación «hallarse entre» se deduce que los 
extremos del segmento pertenecen al segmento y de la simetría de 
esta relación se deduce que [A, B]=[B, A]. Está claro que el seg- 
mento (A, A] está formado sólo por el punto A. 

Se dice que un número A se halla entre los números a y P 
(a, B, AEK), sia<i<B o P<h<a. El conjunto de los números 
que se hallan entre a y $ se llama segmento numérico y se indica 
por [a, B). Del teorema anterior obtenemos el siguiente corolario: 

coroLaRIo. El conjunto de los valores que toma una funcional 
lineal f(X) sobre un segmento [A, B] es un segmento numérico 
pA, f (B)). El conjunto de los valores que toma f sobre la recta Mo 
bien coincide con todo el cuerpo conmutativo K (si f noes constante sobre 
M) obien está formado por un solo número (si f es constante sobre D). 

Introduzcamos ahora el concepto de semirrecta o de rayo. Se dice 
que el punto X se encuentra al mismo lado del punto O que el 
punto A, si X se halla entre O y 4 o si A se halla entre O y X. 

Un conjunto de puntos M, del AE A se llama rayo, si en M, 
existen unos puntos distintos O y A tales que M, está formado por 
todos los puntos X que se encuentran al mismo lado del punto O 
que el punto A. El punto O se llama vértice del rayo que será 
indicado ahora por Woa- 

De esta definición se deduce que todos los puntos del rayo Woa 
pertenecen a la recta OVA. Si tomamos como base de referencia 
coordenada sobre la recta OVA ta base de referencia (0, OA), a todo 
AEK le corresponderá un punto X de coordenada lineal A tal que 
OX =X0A. Está claro que el rayo Mo, consta de todos los puntos 
de la recta OVA que tienen coordenada no negativa. En particular, 
de aquí se ve que todo rayo tiene solamente un vértice O y que 
si sobre el rayo Wg, se toma un punto cualquiera B diferente de O, 
los rayos Moa y Wop coinciden. Es fácil comprobar también que al 
tomar en una recta un punto arbitrario O, la recta se descompone 
exactamente en dos rayos diferentes de vértice O. 
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Supongamos que una funcional lineal f (X) no es constante sobre 
una recta M. En virtud del teorema l, sobre la recta M existe 
un punto O, sólo uno, en el que la funcional f se anula. Puesto que 
la aplicación f (X) — X transforma el orden de K en un orden natural 
de Ùt, los conjuntos M, y M, de puntos de M conA<0 y 4> 0, 
respectivamente, son precisamente aquellos rayos en los que el punto O 
divide a la recta M. 


31,2, Semiespacios. El análogo del concepto de rayo en el caso 
de planos multidimensionales de un espacio A es el concepto de 
semiplano y, en particular, el concepto de semiespacio que pasamos 
ahora a definir. 

Sea de nuevo A un espacio afín sobre un cuerpo conmutativo 
ordenado K y sea $ un hiperplano arbitrario de Y. Si $ contie- 
ne unos puntos X e Y, EJ contiene también -todos los puntos 
de la recta XV Y. Por esto, cualquier segmento [A, B) de A o bien 
está contenido integramente en $ o bien contiene no más de un 
punto de $. Se dice que los puntos A y B se hallan a distintos lados 
del hiperplano $, si ambos no pertenecen a $, pero el segmento 
[A. B] contiene un punto de $. En todos los demás casos se dice 
que los puntos A y B se hallan a un mismo lado de Y lo que se 
expresa simbólicamente así: A==8B($9). En particular, A == A (%) 
y de A= B(Ẹ) se deduce que B == A (P) para cualesquiera A y B. 
Además, si AE$B, se tiene A = B ($) para cualquier punto B. 

Teorema 1. Sea f(X) una funcional lineal no constante sobre el 
espacio A y sea P un hiperplano formado por los puntos X tales 
que F(X)=0. Entonces se tiene para cualesquiera A y B 


A= B (P) E> f (4)-f (B) >0. a) 

Supongamos que A y B se hallan a distintos lados de $. El con- 
junto de los valores que toma f (X) en tos puntos del segmento [A, B] 
es el segmento númerico Va f(B)]. Tenemos, por hipótesis, 
F(A)=40, F (B)=0 y 0€ [F (A), F(B)]. Por consiguiente / (A)-f (8) <0. 
Recíprocamente, supongamos que para unos puntos A y B se tiene 
F(A): F(B) <0. Entonces OE [f(4), f (B)), es decir, para un punto 
XE[A, B) se tiene f(X)=0, de donde X€ $ y por ello los puntos 
A y B se hallan a distintos lados de $. 

COROLARIO. Si el punto A no pertenece al hiperplano $ yA = B (Y) 
y A=C(B), se tiene B =C ($). 

Efectivamente, si los puntos A, B y C satisfacen las exigencias 
indicadas, tenemos según el teorema 1 


F(4)740, HAJHBI>0 y FACOS, 


de donde (F(A)*f(B)F(C)>0 y, por consiguiente, f (B)f (C) > 0- 

Introduzcamos ahora el concepto principal: cualesquiera que 
sean un hiperplano $ y un punto arbitrario 4£%, el conjunto de 
los puntos que se hallan a un mismo lado de Y que el punto A 


5 
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se llama semiespacio definido por el hiperplano Y y por el punto A. 
Convengamos en indicar provisionalmente este semiespacio por Aya. 

Se ve de la definición que Mga contiene indudablemente el punto 
A Y el hiperplano $. El conjunto que se obtiene de Aya omitiendo 
el hiperplano $ se llama semiespacio abierto definido por el hiper- 
plano % y por el punto A. ; 

TEOREMA 2 Si los puntos A y B no pertenecen al hiperplano Y 
y el segmento (A, B] no contiene puntos de R, los semiespacios Wya 
y Uos coinciden. Si los puntos A y C se hallan a distintos lados 
de YB, se tiene Aya Auc y cualquier semiespacio Ayp coincide con 
Aya o con Aac. 

Consideremos una funcional lineal no constante f(X) que se 
anula sobre $. Puesto que el segmento [A, B] no contiene puntos 
de Y, los números f(A) y F(B) son de un mismo signo debido a 
la fórmula (1). Análogamente se comprueba que los números f(A) 
y F(C) tienen signos diferentes. Del teorema 1 resulta que para 
cualquier punto DEW siendo F(D)>0 el conjunto Ayo coincide 
con la colección A* de los puntos X tales que 


Hx)>0 (2) 


y siendo f(D)<0 el conjunto Apo coincide con la colección A” 
de los puntos X tales que 
HX)<0. (3) 


Por consiguiente, un semiespacio arbitrario App coincide con 
2* o con A~. Si f (4) >0, de las relaciones mencionadas obtenemos 


Usa=Uys=2A7 y Ascal; 
en cambio, si f (A) <0, se tiene $ úl 
Uga=Uga=U7 y A=. 


COROLARIO 1. Para toda funcional lineal no constante f(X) el 
conjunto de los puntos X que satisfacen la desigualdad 


Hx)>0 

y el conjunto de los puntos X que satisfacen la desigualdad 
Hx)<0 

representan los dos semiespacios definidos por el hiperplano 
HX)=0. (4) 

y ¡ds conjuntos de los puntos X definidos por la desigualdad es- 

ricta 

i FX) >0 (5) 


y, respectivamente, por la desigualdad estricta 
FX) <0 (6) 
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representan los semiespacios abiertos en los que el hiperplano (4) 
divide al espacio afin dado Y. 

Efectivamente, la ecuación (4) determina, según el p. 29.4, un 
hiperplano $ que define los semiespacios (2) y (3). Los conjuntos 
de los puntos definidos por las desigualdades estrictas (5) y (6) se 
obtienen de los semiespacios (2) y (3) omitiendo las soluciones de 
la ecuación (4) y son, por consiguiente, semiespacios abiertos, 

COROLARIO 2. Supongamos que en un espacio Y de dimensión finita 
n se ha escogido una base de referencia coordenada cualquiera. El 
conjunto de los puntos X cuyas coordenadas E, ..., E” satisfacen 
una desigualdad determinada 


ape. HOE" > 


en la que al menos uno de los coeficientes principales a, ..., œ, es 
diferente de cero, representa entonces un semiespacio definido por el 
hiperplano 

abit... Hak" = 0. a) 


El conjunto de los puntos X cuyas coordenadas satisfacen la de- 
sigualdad estricta 


ae a > a 


representa un semiespacio abierto definido por el hiperplano (7). 

La funcional definida mediante la fórmula 

FX) =a 84... +a,"—a 
es, por lo visto en el p. 30.1, lineal y no constante sobre A, Apli- 
cando a f el corolario 1, obtenemos las afirmaciones requeridas. 

Hemos considerado hasta el momento los casos, en cierto sentido, 
extremos: rayos o semirrectas y semiespacios. No obstante, es fácil 
definir también el concepto de semiplano para un plano cualquiera 
Wt contenido en el espacio A. En efecto, sabemos que M puede 
ser considerado como un subespacio sobre el mismo cuerpo conmu- 
tativo K sobre el cual está definido el espacio A. Aplicando lo 
expuesto anteriormente al espacio afín WM sobre K, obtenemos el 
concepto de a del espacio Mt. Estos semiespacios se lla- 
man: semiplanos del plano W. 

TEOREMA 3. Supongamos que el guo M y el hiperplano Y no 
son paralelos y sea Á un punto de It que no pertenece a R. La in- 
tersección del semiespacio Aya y del plano Dt será entonces un semi- 
plano en WM definido por el punto A y el hiperplano MNP del 
espacio M. 

Todo semiplano de W es la intersección de M con un semiespacio 
adecuado Aya del espacio A. 

Sea f(X) una funcional lineal no constante que se anula sobre 
R y sea [(A4) >0. El semiespacio Aga es entonces el conjunto de 
las soluciones de la desigualdad f(X)>0 y la intersección MN La 
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es el conjunto de los puntos Y EM que satisfacen la desigualdad 
f(Y)>0. Puesto que la contracción de f sobre M es una funcional 
lineal sobre Alt, resulta, según el corolario 1, que el conjunto 
MNAya es un semiplano en M. Análogamente se demuestra la 
segunda afirmación del teorema 3. 

Volviendo de nuevo a los semiespacios del espacio U plantéemonos 
el problema: ¿de qué modo pueden situarse con respecto uno al oiro 
dos semiespacios Aga y Ans? 

Consideremos por separado cada uno de los tres casos que pue- 
den darse aquí: 

1) Los hiperplanos $ y Q coinciden. Entonces los semiespacios 
Mea y Aos o bien coinciden o bien la unión de ellos es todo el 
espacio A l la intersección es el hiperplano P. 

2) Los hiperplanos $ y D no se cortan y, por consiguiente, son 
paralelos. Aquí pueden darse los siguientes subcasos: 

a) Pédos y DE Apa; entonces Aya N Ana =D. 

b) BEA y DÉEAna; entonces Ana > Aga. 

c) PEAas y DE%ga; entonces Aya > Ana. 

d) PEA y DEALA; entonces Aga N Ana HD. 

Los conjuntos del último tipo se llaman a veces hipercapas, La 
intersección de cualquier recta con una hipercapa es, como puede 
verse fácilmente, vacía o coincide con toda la recta o es un seg- 
mento de la recta. 

3) Los hiperplanos $ y Q se cortan. El conjunto PNL es, se- 
gún el p. 29.2, un plano de codimensión 2. En este caso la inter- 
sección de los semiespacios Apa NAoa se llama hiperángulo de 
arista PND. 

31.3. Conjuntos convexos. Un conjunto © de puntos de un es- 
pacio afín y sobre un cuerpo conmutativo ordenado K se llama 
convexo, si 

XEG e YESS [X, Y]ES. 0) 

De aquí se deduce que los planos del espacio A, así como los 
segmentos, rayos, semiplanos y semiplanos abiertos de A son conjun- 
tos convexos. 

De la definición (1) se ve directamente que la intersección de 
cualquier familia de conjuntos convexos es un conjunto convexo. En 
particular, la ann de cualquier familia de semiespacios es 
un conjunto convexo. 

La “intersección de todos los conjuntos convexos que contienen 
un conjunto fijo de puntos M se lama adherencia convexa. del 
conjunto M y se indica por ConvWM. De la observación hecha 
anteriormente se desprende que la adherencia convexa de un conjunto 
cualquiera M es el menor conjunto convexo que contiene a M. 
Está claro que W es convexo cuando, y sólo cuando, ConvM =%M, 
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También es evidente que de M <A resulta Conv M S Conv N. Todo 
punto XEAN constituye por sí mismo un conjunto convexo y, por 
consiguiente, Conv X =X. Sin embargo, ya para dos puntos X e Y 
tenemos, como puede verse fácilmente, la fórmula 

Conv(X, Y)=[X, Y]. (2 


El teorema que sigue ofrece la expresión para la adherencia 
convexa de un conjunto cualquiera. 

TEOREMA 1. Escojamos en el espacio A un punto O. La adherencia 
convexa Conv M de un conjunto arbitrario de puntos M es el conjunto 
de todos los puntos XE%A tales que para cada uno de ellos existe 
en M un sistema finito de puntos My, -.., M, ligados a X por la 
relación 


OR =h,- OM, +... +%:0M,, (3) 
donde A,, ..., A, son unos números adecuados de K sometidos a las 
condiciones 

2m>0, ...,1,>0, (% 
A+... +k=l. (5) 


Indiquemos por M, el conjunto de los puntos X que cumplen 
las exigencias (3), (4) y (5) y demostremos que M, es convexo. 
Sean A, BE Dt, de modo que para convenientes M,€M y a, PJE K 


se tenga 
DA =a0M, +... +4,:0M,, 
0B=f,-0M,+...+B,:0M,, 
donde 


a/>0,B,>0 (i=l,..., s), 
ato += +. +B=l. 
Para un punto cualquiera X€ (A, B] tenemos 
OR =1-04+u:08  (.>0,1>0 y A+u=1) 
y, por consiguiente, 
OX =(Ma,+18)-0M,+...+(0,+uB,)-0M,. 
Puesto que aquí 
da +HB,>0 2.» 8) 
Doute) =i Do +u Zp =l, 


resulta que XEM, y el conjunto M, es convexo. 

Resta demostrar que todo conjunto convexo N que contiene al 
conjunto Di contiene también todos Jos: puntos X que satisfacen 
las condiciones (3), (4) y (5). En estas condiciones figura el número 


y además 
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natural s y para s=1 la afirmacion que acabamos de enunciar es 
trivial. Apliquemos ahora la inducción según s. Supongamos que 
para un valor de s cualquier Punto X que satisface las condiciones 
(3), (4) y (5) pertenece a N. Consideremos el punto Y que satisfaga 
las condiciones 


OY =a, 0M,+...+0%,:0M,+0,1:0M,,1, (MEM), 
ato. tatamn=l q0 (i=l, ..., s+l). 


Siendo aquí a,=0 0 œ,,,=0, tenemos, por la hipótesis de induc- 
ción, YEN. Supongamos por esto que &s-a,+, > 0, de modo que 
tomando p=- ... +a, tendremos p> 0. El punto X definido 


por la relación 
OR =4 0M, +.. +52 OM, 


satisface las condiciones (3), (4) y (5) con s fijo y, por consiguien- 
te, XEN. Tenemos ahora 


OY =p OR tas OM (44% =1, PSO y ass 20), 


de modo que YE[X, M;,1). Como N es convexo y X, Ms, EM, 
tenemos Y EN que es lo que se quería demostrar. 

En cada una de las condiciones (3) figura solamente un número 
finito de puntos del conjunto. Por ello, del teorema 1 resulta que 
la adherencia convexa de un conjunto infinito de puntos es la unión 
de las adherencias convexas de todos los subconjuntos finitos del con- 
junto dado. 

Se dice que la dimensión de un conjunto convexo E es igual a r, 
si E está contenido en un plano r-dimensional y no está contenido 
en ningún plano de menor dimensión. Análogamente se define tam- 
bién la codimensión de un conjunto convexo. 

COROLARIO. Si el número máximo de puntos linealmente indepen- 
dientes del conjunto M es igual a r+1, la dimensión de Conv Wt 
es igual ar. 

upongamos, por ejemplo, que todos los puntos del conjunto M 
dependen linealmente de los puntos linealmente independientes 
As Ay <.. A, de este conjunto. Entonces M está contenido 
en el plano N=A, V A, V...V A, de dimensión r y por ello 
Conv W = Conv N. Pero un plano es un conjunto convexo y, por 
consiguiente, Conv M <= N. 

Un conjunto convexo © se llama propio en el espacio Y, si la 
codimensión de S es igual a cero. Los demás conjuntos convexos 
se llaman impropios en YU. Como ejemplos de conjuntos convexos 
propios podemos indicar el mismo espacio Y, asi omo los semies- 
pacios y los semiespacios abiertos de éste. Los planos de codimen- 
sión no nula y sus semiplanos son conjuntos convexo: impropios en A. 
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Está claro que todo conjunto convexo S es un conjunto convexo 
propio en el plano que sirve de adherencia lineal de ©. 


Se dice que un punto S se halla estrictamente dentro del seg- 
mento (A, a: si $ es diferente de A y de B y SE[A, B]. Un 
punto se llama interior de un conjunto convexo S, si en toda 


recta que pasa por S existe un segmento que contiene a S estric- 
tamente dentro de sí y pertenece íntegramente a ©. 

Se dice que un punto $ es tangente a un conjunto convexo 3, 
si existe una recta que pasa por S tal que cualquier segmento de 
ella que contenga al punto S estrictamente dentro de sí contenga 
al menos un punto de S. En particular, todos los puntos del con- 
junto © son_tangentes a S. Pero pueden también existir puntos 
tangentes a S que no pertenezcan a ©. Si todos los puntos tangentes 
a © pertenecen a S, se dice que 3 es un conjunto cerrado. Un 
conjunto convexo S se llama abierto, si todo punto S suyo es un 
punto interior de S. 


TEOREMA 2. La intersección de una familia arbitraria de conjuntos 
convexos cerrados es un conjunto convexo cerrado, La intersección de 
una familia finita cualquiera de conjuntos convexos abiertos es un 
conjunto convexo abierto. 

La primera afirmación se deduce directamente de la definición 
de los conjuntos cerrados. Demostremos la segunda afirmación. Sean 
M y M unos conjuntos convexos abiertos. El conjunto MANN es 
entonces convexo. Si es vacío, no hay nada que demostrar, ya que 
los conjuntos vacíos son, por definición, abiertos. Sea SEM NM 
sea Y una recta cualquiera del espacio A que pasa por el punto g 
Sobre esta recta existen, por hipótesis, unos segmentos que contie- 
nen a S estrictamente dentro de si y que pertenecen a los respectivos 
conjuntos M y N. Pero la intersección de estos segmentos será en- 
tonces el segmento deseado que pertenece a MNN y que contiene 
al punto S estrictamente dentro de sí. 

Introduzcamos otro concepto importante. Un punto S se llama 
punto frontera de un conjunto convexo ©, si S es tangente a ©, 
pero no es interior de 6. En otras palabras, se dice que S es un 
punto frontera de S, si existe una recta que pasa por S tal que 
todo segmento de la misma que contenga al punto S estrictamente 
dentro de sí contenga al menos un punto de E y un punto que no 
sea de 6, El conjunto de todos los puntos frontera de un conjunto 
convexo © se llama frontera del conjunto ©. 


TEOREMA 3. Un semiespacio arbitrario Yea, definido en el espacio 
A por un hiperplano SB y por un punto A que no se halla sobre $, 
asi como el semiespacio abierto correspondiente Ula =ApaN Y, son 
unos conjuntos convexos cerrado y abierto, respectivamente, en A. La 
Frontera de ambos conjuntos es el hiperplano $. Todo conjunto con- 
vexo © impropio en Á no contiene puntos interiores. 
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Sea PER. Consideremos la recta AVP y en ella un segmento 
arbitrario [B, C] que contiene al punto P estrictamente dentro de 
sí. Puesto que la recta AVP no se halla sobre Y, los extremos 
del segmento [B, C] tampoco pertenecen a Y y, como PE[B, C), 
los puntos B y C se hallan a distintos Jados del hiperplano Y. Por 
consiguiente, uno de los extremos B o C pertenece al semiespacio 
abierto Aga y el otro extremo no pertenece a Aya, Luego, el punto 
P es un punto frontera tanto de Aya como de Aga. 

Demostremos que cualquier punto DE Mya no es tangente a Aya 
y, por consiguiente, tampoco es tangente a Aga. Sea M una recta 
cualquiera que pasa por el punto D. Si esta recta no se corta con $, 
pertenece integramente al semiespacio Ago =Ayo /8 y, por ello, 
todo segmento de la misma no contiene puntos de Aga. Si M se 
corta con $ en un punto P, existen en unos puntos B y C di- 
ierentes de D y P tales que Deh, P) y CEID, P]. Por consi- 
guiente, el segmento [B, C] se halla sobre W, contiene a D estric- 
tamente dentro de sí y no contiene puntos del semiespacio Aya. Por 
esto, el punto D no es tangente a Aya. Al mismo tiempo hemos 
demostrado que todos los puntos del semiespacio abierto Aga son 
interiores y, por consiguiente, cualquier semiespacio abierto es un 
conjunto convexo abierto. 

ara demostrar la última afirmación del teorema es suficiente 
indicar por % el hiperplano que contiene, por hipótesis, al conjunto 6 
y observar que todo segmento de la recta AVP (PES y AEB) 
que contiene estrictamente dentro de sí al punto P contiene también 
necesariamente puntos que no pertenecen al hiperplano Y. 

De los teoremas 2 y 3 obtenemos un corolario importante. 

COROLARIO 1. La intersección de cualquier familia de semiespacios 
de un espacio A es un conjunto convexo cerrado de Y. La intersec- 
ción de cualquier familia finita de semiespacios abiertos del espacio 
M es un conjunto convexo abierto de A. 

Recordando que cualquiera que sea la funcional lineal no cons- 
tante f (X) el conjunto de soluciones de la desigualdad f (X) => 0 
es un semiespacio y el conjunto de soluciones de la desigualdad 
estricta f (X) > 0 es un semiespacio abierto, obtenemos ótro corolario. 

CoroLARIO 2. Sean [,(X), ..., f,(X) unas funcionales lineales no 
constantes sobre un espacio afín A. Entonces el conjunto de las so- 
luciones X del sistema de desigualdades 


f(0>0 (i=l, ..., s) 


es un conjunto convexo cerrado de Y y el conjunto de las soluciones 
del sistema de desigualdades estrictas 


f,00>0 (i=1, ..., 5) 
es un conjunto convexo abierto de A. 
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Un hiperplano $ se llama hiperplano soporte de un conjunto 
cometo Ei $NS>2 y todos los puntos de S se hallan a un 
mismo lado de $. Las intersecciones de los hiperplanos soportes 
con el conjunto © se llaman facetas de S. De estas definiciones 
se desprende directamente que las facetas de los conjuntos convexos 
pertenecen a las fronteras de estos conjuntos y son ellas mismas 
conjuntos convexos, Las facetas de los conjuntos convexos cerrados 
son conjuntos cerrados. 


Complementos y ejemplos 


Sea A un espacio afín arbitrario de dimensión finita n=} sobre un cuerpo 
conmutativo ordenado K. 

1. La adherencia convexa de unos puntos Ay, .... A+, linealmente inde- 
pendientes se Mama simplice r-dimensional de Y. Si y < n, este símplice se halla 
en el plano r-dimensional A1V...VAr+, y por lo tanto es un conjunto con- 
vexo impropio en A. Los simplices n-dimensionales se llaman simplemente sim- 
piles de A. kos puntos Ay 7.0. Anpe Se laman vértices del. simplice 


Conv Ay <., Ansah. 

2. Describanse los simplices de los espacios unidimensionales, bidimenslo- 
nales y tridimensionales. 

3. Para todo r, 0&7 «<n—!, todas las facetas r-dimensionales de un sim- 
plice A=Conv (Ay, An+1) Son unos simplices Conv (Ay,» 
Ugh s... <i antl) 

'4. Todo conjunto convexo S compuesto sólo de puntos frontera de un sim- 
plice A pertenece integramente a un simplice (n—l)-dimensiona) A= 
=æ Conv {Az ..., Áj=jo Aito iee Ane h 

5. SY los puntos Ay, «s, Appi son linealmente independientes y par 
puntos Bj, ..., Bpy1 Se tene 


Conv (Az, +...» Ars) =Conv (Bj, -»0. Berib 


los conjuntos {A Arsa} y (Br Br+1) coinciden. 
6. La adherencia convexa C=Conv (Cy, ..., Cy) de un sistema finito arbi- 
trario de puntos Cı, ..., Cs de W se llama poliedro convexo de Y. 
Un sistema de puntos se lama convezamente irreducible, si ningún punto 
del sistema no está contenido en la adherencia convexa de los demás puntos. 
Demuéstrese que siendo C=Conv (C,, ..., Cs) un poliedro convexo, existen 
unos puntos Cy y +«.1 Cip IE <... < Is tales que el sistema de los pun- 
tos Cj, +.» Ci, es convexamente irreducible y 


Conv (Cr, -.-, Cs) = Conv {C; Ca} 


7, Un simplice S se llama simplice diagonal! de un poliedro convexo s-di- 
mensional C generado por un sistema convexamente irreducible de puntos 
Car sgr Gaga Si los vértices del simplice pertenecen al conjunto (Cp... Cesu}, 

Se dice que un simplice r-dimensional A y un simplice $-dimensional 8 
están en posición regular (uno con respecto al otro), si o no se cortan o se 
cortan por un conjunto que es una faceta tanto de un simplice como del otro- 

Tiene lugar la siguiente proposici 

Existe un conjunto de simplices diagonales de un poliedro S tal que todo 
punto del poliedro pertenece a la unión de estos simplices y cualesquiera dos 
simplices de este conjunto están en posición regular. 


Aira 


unos 


25—1843 
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$ 32. Espacios euclídeos puntuales 


En los parágrafos anteriores hemos estudiado las propiedades 
de los espacios afines definidos sobre un espacio vectorial dado g. 
Supongamos ahora que el espacio vectorial Y es unitario o euclideo. 
Un espacio afín sobre un espacio vectorial unitario (respectivamente, 
euclideo) L se llama espacio puntual unitario (respectivamente, 
euclídeo) sobre £. Se llama dimensión de un espacio puntual uni- 
tario sobre Q la dimensión del correspondiente espacio vectorial 
unitario £. En lo que sigue dedicaremos la atención principal al 
estudio de los espacios puntuales euclídeos sobre el cuerpo de todos 
los números reales. Puesto que el cuerpo de los números reales es 
ordenado, en los espacios puntuales euclídeos está definido el con- 
cepto de convexidad (p. 31.3). 


32.1. Longitud de una quebrada. Sea ll, un espacio puntual 


unilario de a dimensiones sobre un espacio vectorial unitario £ de- 
finido sobre el cuerpo conmutativo K. A todo par de puntos A y B 
de U, corresponde un vector univoco AB de £. Puesto que el espacio 
vectorial L es unitario, en £ está definido el concepto de longitud 
del vector AB. Indicaremos por p(4, B) esta longitud llamándola 
distancia del punto A al punto B. Por consiguiente, tenemos por 
definición 

p(A, B)=/ AB |= (AB, AB). 0) 


De las propiedades de las longitudes de los vectores (p. 17.2) 
se desprende que para cualesquiera puntos A y B se tiene 

LN p(A, B)=p(B, A). 

2 p(A, B)=0& A=B. 

Como para cualesquiera puntos A, B y C de U, se tiene AC = 
= ĀB+BČ, de la estimación para la longitud de una suma de vec- 
tores resulta 

3 p(A, B)+p(B, C)>P(4, C). 

Un conjunto acbitrario M tal que a todo par A, B de sus ele- 
mentos corresponde un número real no negativo p(A, B) que satis- 
face las exigencias 1°, 2° y 3° se llama espacio métrico de métrica p. 


Por esto la definición (1) convierte un espacio puntual unitario en 
un espacio métrico. 


Aplicando sucesivamente la desigualadad 3°, Megamos fácilmente 
a la desigualdad más general 
PA, AJHP(Ay AH- Hols A) >P (An A) (2 


válida para cualquier sucesión finita de puntos Aj, ..-, A, de un 
espacio puntual unitario. 
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Si un espacio puntual U, es euclideo, el campo principal K — 
que es el cuerpo de los números reales-—es ordenado y, por ello, 
todo par de puntos A y B de U, determina un segmento A B| 


(p. 31.1). El número p(A, B) se ilama longitud del segmento (A, B]. 
Bada una sucesión cualquiera de puntos Ay, Aj, ..., As, la sucesión 
de los segmentos 

[An As), [An As), ><, [Asp 45) 


se llama quebrada que une A, y A, y el segmento [4,, A,] se llama 
segmento resultante de la quebrada. La suma de las longitudes de 
los segmentos de una quebrada se llama longitud de la quebrada. 
La desigualdad (2) significa que en un espacio euclideo cualquiera 
la longitud de una quebrada es no menor que la longitud de su 
segmento resultante. 

¿Bajo qué condiciones en la desigualdad (2) tiene lugar el signo 
de igualdad? Según el p. 17.2 (para s=2). en un espacio vectorial 
unitario de las relaciones A,A,>+0 y 


A E a (8) 


se deduce que los vectores A,A;,, dependen linealmente de A,A, 
y por lo tanto 


An =h (=l, ..., 5—1). 


Introduciendo estos valores en (3) y dividiendo por 4,4, ||, llega- 
mos a la igualdad 


JARA ld Ral lA AAA Aea l (4) 


Si el espacio es euclideo, los números M, ..., A,., son reales y la 
igualdad (4) es verídica cuando, y sólo cuando, estos números son 
de un mismo signo. Está claro que en este caso los puntos Ay, 
Ay «>, A, se hallan sobre una misma recta y que los segmentos 
sucesivos [A Al, [An As]. ---, [As As] de la quebrada se 
intersecan sólo en los correspondientes puntos extremos. Es decir, 
en un espacio puntual euclídeo la longitud de una quebrada es igual 
a la longitud del segmento resultante cuando, y sólo cuando, la 
quebrada es una partición del segmento resultante. 

Veamos ahora como determinar la distancia entre los puntos 4 
y B de un espacio puntual unitario U, si se conocen las coordena- 
das de estos puntos. Sea (O, e,, ..., e,) una base de referencia 
coordenada de Ul, cuyos vectores forman un sistema ortonormal en 
el espacio vectorial Y. Indicando por æ, ..., œn Y Bis ..., Pa las 
coordenadas de los puntos A y Ben la base de referencia señalada, 
tendremos 


AB=0B—04 = (b, —a,)e, + > + (Pu — 2a) en 
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de modo que 
O A F Bn F (5) 
Si el espacio U, es euclideo, las coordenadas de los puntos serán 
números reales y, por consiguiente, la fórmula (5) puede ser repre- 
sentada en la forma 


PA B=V EFE a (6) 


Al deducir estas fórmulas hemos aceptado que los vectores de la 
base de referencia coordenada forman un sistema ortonormal. Estas 
bases de referencia se llamarán ortonormales. Si en lugar de una 
base de referencia coordenada ortonormal se toma una cualquiera, 
la fórmula para la distancia entre dos puntos adquiere una forma 
más compleja que aquí no la daremos. 


32.2. Angulo entre rectas. Consideremos en un espacio puntual 
unitario 1, de n dimensiones dos rectas cualesquiera X y Y. Tome- 
mos en cada una de estas recías un par de diferentes puntos Ay A, 


y Ay Aa respectivamente, Los vectores TA, y |, que corres- 
onden a' estos pares satisfacen la desigualdad” de Cauchy—Bunia- 


ovski 
AR. HAM <i. 
MAA NASA. 


Por lo tanto, existe un número real ọ que satisface la exigencia 


LAA. AA ES 
a (0<w<3). m 


Este número q no depende de cómo se escogan los pares indicados 
de puntos en las rectas X y Y. Efectivamente, si B,, B, y By, Ba 
son otros pares análogos, se tiene 


BB,=»A,A, y B,B,=4:A,4, 
para unos valores adecuados A, € K y por ello 
BB, BB _ 13 Aife BADI cos. 
NBB: W838) TTET AAN- AAN 


Luego, el número real y que cumple las exigencias (1) depende 
sólo de las rectas X y Y y se llama magnitud del ángulo entre las 
rectas X y Y o simi Tenante ángulo entre las rectas È y Y. 

Las rectas X y $ se llaman perpendiculares, si el ángulo entre 
ellas es igual a 1/2. De las relaciones (1) se deduce que las rectas 
Æ y Y son perpendiculares cuando, y sólo cuando, cualquier vector 
que se halla sobre una de estas rectas es ortogonal a cualquier vector 
que se halla sobre la otra recta. 


cosp= 


RE? 
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Notemos también que el ángulo entre las rectas È y Y es igual 
a cero cuando, y sólo cuando, las rectas son paralelas. 

En efecto, si las rectas son paralelas, los vectores que se hallan 
sobre estas rectas son linealmente dependientes y por ello en la 
fórmula (1) tenemos A¿A,¿=1-A,A, y mediante simplificaciones 
directas obtenemos cosp=1 y p=0. Reciprocamente, sea p=0 y, 
por consiguiente, 

LAA. AA) = AA, AAA 1 
Este es el caso en el que en la desigualdad de Cauchy — Buniakov- 
ski tiene lugar el signo de igualdad. Por consiguiente, A,A, =A: A, Az, 
de modo que las rectas X y Y son paralelas. 

Fijemos en el espacio unitario U, una base de referencia coor- 
denada ortonormal (O, €, ..., €,). Como sabemos las ecuaciones 
de las rectas Æ y Y pued len ser representadas en la forma 


hit, (2) 


=b ae, 8) 
donde t es un parámetro y l,, ..., l, y m, , M, son los coefi- 
cientes directores. Supongamos que el punto” A se obtiene para el 
valor ¿ =t; (i=1, 2, 3, 4). Indicando por %;, ..., Qin las coorde- 


nadas del punto A¡(¿=1, 2, 3, 4), tendremos 


aj=lti+ E (i=1, 2 s=1, ..., n), 
aj =mbt+n ((=3, 4 s=1, ..., n) 
y, por consiguiente, Si 


AA (t,t) (et -o + lnea) 
TA, = (t, —4,) (me, +... mae). 
Introduciendo en la fórmula (1) estos valores, obtenemos 
Lim blema! 4 
sen AREF FE Vm EF FF S4 
Esta es la fórmula estandard para el coseno del ángulo entre unas 
rectas dadas por las ecuaciones canónicas (2) y (3) en un sistema 
de coordenadas ortonormal. Tomando la recta (3) como la recta 
coordenada sésima, definida por las ecuaciones 
A O 
A E 
e indicando por q, el ángulo entre la recta (1) y esta recta coor- 
denada, obtenemos 


cos, = 


Tait 
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y, en particular, 
costo, +... Heo q = l. (5) 


Hemos visto ya en el p. 30.3 que la condición de paralelismo 
de las rectas (2) y (3) puede ser representada en la forma 


Hs la 


Tomando en la fórmula (4) p=5, llegamos a la relación 


hm +... +lm,=0, (6) 
que representa la condición de perpendicularidad de las rectas dadas 
por las ecuaciones canónicas en una base de referencia coordenada 
ortonormal. 

En los espacios puntuales euclídeos se introduce también, ade- 
más del concepto de ángulo entre rectas, el concepto de ángulo 
entre rayos. Las ecuaciones canónicas de los rayos en un espacio 
euclídeo n-dimensional puntual también se representan en la forma 
(2) y (3), donde E? ..., E2 y m?, -.., 93 son las coordenadas de 
los “vértices de estos rayos, y las coordenadas E,, ..., E, de un 
punto arbitrario de estos rayos se obtienen de las ecuaciones indi- 
cadas dando al parámetro f unos valores no negativos arbitrarios. 
Puesto que el campo principal es en este caso el cuerpo de los 
números reales, existe un número real único œ que cumple las 
exigencias 


TON 
BR FAV a 
ques denomina ángulo entre los rayos señalados. Según estas 
lefiniciones el ángulo entre cualesquiera rectas está comprendido 
siempre en los límites O y $, mientras que el ángulo entre unos 


rayos puede ser también obtuso. Supongamos, por ejemplo, que un 
rayo está dado por sus ecuaciones canónicas 


cos pm OSP, (7) 


La ecuación del rayo opuesto que con el rayo dado forma una 
recta integra es entonces de la forma 


E 


o en forma canónica 
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Calculando el ángulo entre estos rayos opuestos según la fórmula 
(7), obtenemos cosp=—1 y por lo tanto p=1. 


32.3. Proyecciones ortogonales. Empleando el concepto de per- 
endicularidad de rectas es fácil definir la relación de perpendicu- 
laridad de unos planos k-dimensional y /-dimensional en un espacio 
unitario U,. Se dice que la recta X del espacio U, es perpendicular 
a un plano AR k-dimensional de N,, lo que se indica simbólicamente 
pe Ed M, si X es perpendicular a cualquier recta que pertenezca 
a 


Puesto que la perpendicularidad de las rectas equivale a la 
ortogonalidad de los vectores no nulos que se hallan sobre ellas, 
se tiene 

ILMO, (0) 
donde WM significa el subespacio tangente al plano W (en las nota- 
ciones del p. 29.3 se tiene M=L(M)). 

Una recta X se llama perpendicular trazada desde el punto A 
hacia el plano M, si X pasa por A, es perpendicular a Mi y se 
corta con M en un punto P, El punto P se llama base de la 
perpendicular trazada desde A hacia W o proyección de A sobre W. 

TEOREMA |. En un espacio unitario U, de n dimensiones desde 
todo punto A que no se halle sobre un plano arbitrario k-dimensional 
M(U<k<n—1) se puede trazar una perpendicular hacia W, y 
sólo una. 

UNICIDAD Supongamos que existen dos rectas diferentes AVB y 
AVC (BC; B, CEM) perpendiculares a M. Estas rectas deben 
ser entosi perpendiculares a la recta BVC que se halla sobre el 
plano W. 

Supongamos que las rectas AVB, AVC y BVC—que se hallan 
obviamente sobre el plano bidimensional AY BWC—tienen, en una 
base de referencia ortonormal del plano AVBVC, los coeficientes 
directores (l, 1), (m,, m,) y (n,, n,), respectivamente. La condición 
de ortogonalidad de las rectas AVB y BVC implica la igualdad 
hn, + ly, =0 (véase (6); análogamente la ortogonalidad de AVC 
y de BVC implica la igualdad m,n,-+m,n,=0. Vemos que el 
sistema 

Lx + lx, =0, 1 
mx+m,x,=0 | 
tiene una solución no trivial (n,, n,). Por consiguiente, 
A G 
m, m,| 


es decir, ish. Luego, las rectas AVB y AVC son paralelas 
(véase el p. 30.3) y tienen un punto común A. De aquí se des- 
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prende que ellas coinciden. La contradicción obtenida concluye la 
demostración de la unicidad. 

EXISTENCIA. Supongamos primero que M es un hiperplano, es 
decir, que £=n—1. En N, existe, según el p. 17.5, un subespacio 
vectorial de una dimensión W+ ortogonal a W. El conjunto A- M1 
es una recta que pasa por A y es perpendicular a Mi. Resta probar 
solamente que A-MiL se interseca con W. Pero, esto es evidente, 
ya que en el caso contrario la recta A-MAL sería paralela a W y 
por lo tanto en M existiria una recta paralela (y no perpendicular) 
a AMa, 

Si ahora M no es un hiperplano de U,, consideremos el subes- 
pacio N=AVM. El conjunto DM es un hiperplano del espacio 
unitario N. Luego, según lo anterior, desde Te puede trazar 
dentro de N una perpendicular hacia Wt. Es obvio que esta perpen- 
dicular, será también una perpendicular dentro del espacio prin- 
cipal U,- 

En el teorema (1) se resuelve el problema sobre la posibilidad 
de trazar desde el punto A una perpendicular de modo que corte 
el plano W. Veamos cuál es la situación, si omitimos esta exigen- 
cia. Según el p. 17.5, el conjunto ML de todos los vectores del 
espacio U, ortogonales a Ñ es un subespacio vectorial de dimensión 
n—k, Por esto el conjunto A-E. será el conjunto de los puntos 
que se hallan sobre todas las rectas que pasan por A y que son 
perpendiculares a M. Puesto que ML es un subespacio vectorial de 
dimensión n—k, el conjunto A- Dt es un plano (n—4)-dimensional. 
La intersección de A-V1 y de M no puede contener ninguna recta 
X, ya que en el caso contrario cualquier vector que se halla sobre X 
pertenecería simultáneamente a los espacios M y ML, lo cual es 
imposible. Por consiguiente, la intersección de M y A-ML o es 
vacía o consta de un solo punto. Si AEW, la intersección de WM 
Y A-MiL consta, obviamente, del punto A. En cambio, si A¢ ®t, 
la base de la perpendicular trazada desde A hacia M pertenece 
simultáneamente a 4- ML y a M y, por ello, el conjunto Mn AM 
está formado solamente por la base de la perpendicular mencionada. 
El plano A-ME% suele llamarse a veces complemento ortogonal a M 
trazado por el punto A. En particular, si Wè es un hiperplano y 
AIM, el complemento ortogonal A-ML es la recta que es perpen- 
dicular al hiperplano M y que lo intercepta en el punto A Esta 
recta se llama perpendicilar al hiperplano Wè levantada desde el 
punto A. 

Se Ilama proyección (con más precisión, proyección ortogonal) de 
un punto Æ sobre un plano cualquiera M el punto de intersección 
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de los planos M y A-ML, En otras palabras, si AEM, se Ilama 
proyección de A sobre M la base de la perpendicular trazada desde A 
hacia WM. Si AEM, se llama proyección de A sobre M el propio 
punto A. La proyección de A sobre M se indica a veces por Pra A 
o por Am. La aplicación Prw:U,—M se llama proyección (orto- 
gonal) del espacio U, sobre el plano M. 

Veamos cómo se expresan las coordenadas de la proyección del 
punto A sobre el plano Wi en términos de las coordenadas de A. 
Tomemos en el espacio W una base orto- 
normal e,, ..., e, y complementémosla con 
los vectores €, ,, --., €, hasta obtener una 
base otronormal la 
el espacio U,. Fij 
cualquiera O” y tomemos como base de 
referencia coordenada de U, la base de 


referencia (O, e, ..., €). Sean %, ..., p 

las coordenadas del punto A en esta base 

de referencia. Demostremos que la proyec- Fig. 10, 

ción de A sobre M será el punto P con 

las coordenadas œ, ..., %p 0, ..., O (véase la fig. 10 para k= 2). 
En efecto, el plano W consta de los puntos cuyas filas coordenadas 
son de la forma Èr s.s» En 0, ..., 0). Por esto todo vector x 
perteneciente a Wt puede ser representado en la forma e, +...» 


+. Ext Pero PA=0p4 100414. Hana y por lo tanto se tiene 
(x, PA)=0, es decir, la recta PVA es perpendicular al plano WM 
que es lo que se quería demostrar, Luego, si 


TA =ae t... Hoet. -H Anen 


resulta he 
OAm=ae t.. HA + (2) 
M=0 V Oe, V ... V Oep- 

De la fórmula (2) se desprende directamente el siguiente teorema 
importante. 

TEOREMA 2. La proyección ortogonal Pra:N,—M es una aplica- 
ción lineal, es decir, para cualesquiera puntos AW, AW, AW, AW, 
AW y A% y para cualesquiera números », y €K la relación 


donde 


ADAS =A ASAT o p- ADA (5) 

implica 
APAR =h. ARAW +p- APAW. 4) 
Efectivamente, indicando por a®, ..., as las coordenadas del 


punto A (¿=1, ..., 6) y tomando en consideración la condición 
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(3), obtenemos las igualdades 


aP aP =2 (00 — a) + (037 ag”) 


Por otra parte, debido a (2), tenemos 


ARA (aa) ey HOP — 0) E, (1=2, 4, 6). (6) 
Comparando (6) y (5) llegamos a la relación (4). 

e llama proyección Es; de un conjunto arbitrario de puntos € 
sobre un plano W el conjunto de las proyecciones sobre WM de todos 
los puntos de 6. 

TEOREMA 3. La proyección de una recta X sobre un plano cual- 
quiera M es una recta o un punto. Si X%, ..., X® son unas rectas 


de un espacio unitario U, y Dt es un plano cualquiera de Up, se 
tiene 


(RVV... VE =V. VAN. m 

Tomemos en cada una de las rectas X un par de puntos dife- 

rentes AW, B® (i=1, ..., s). El plano XWV... VÆ® está for- 
mado por aquellos puntos C para los cuales 


ACen O E 
A ATAT 


para unos valores adecuados A, ..., As Pa 
p. 29.2). Basándonos en (4), obtenemos de aquí 


ATA, ADE +... HAs APBR + 
+e APAR + + ARAP, ©) 


Ha AVAS (8) 
., BsEK (véase el 


de modo que 
Ca = (AV BE) V .... VIAR V BW). 
Reciprocamente, si 
DEAR V BWV . - . VIAS V BR), 
para valores adecuados Aj, ..., hy Har HEK se tiene 
ARD=2 AB... +2, AD BR + 


+ AÑADA. + ARAR. (10) 
Tomemos en el espacio XWV...VX'% un punto C tal que se 
cumpla la igualdad (8). Comparando (9) y (10) vemos que Ca= 
y por ello DE(AWV... VX®}x. Vemos, por consiguiente, que 
(RPV... VE) = (AS V BEI V VAR V BE). 
Para s=1 obtenemos rad. Por consiguiente X$? = 
= A$} V BS? y quedan demostradas ambas afirmaciones del teorema 3. 
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COROLARIO. En un espacio unitario la proyección de un plano N 
sobre otro plano es de nuevo un plano cuya dimensión no sobrepasa 
la dimensión de VN. 

Para la demostración es suficiente representar el plano N en 
forma de la adherencia lineal de las rectas independientes que 
pasan por un punto y aplicar la fórmula (7). 

En tos espacios puntuales euclídeos están definidos los conceptos 
de segmento y de cuerpo convexo. Mediante la fórmula (4) se 
comprueba fácilmente el teorema siguiente. 

TEOREMA 4 En un espacio puntual euclideo la proyección de un 
segmento cualquiera [A, B] sobre un plano M es un segmento [Am, 
Bm] y por ello la proyección de cualquier conjunto convexo es un 
conjunto convexo. 

En efecto, si CE[A, 8B), se tiene AT=1.AB, OSASI. De 
aquí se deduce, debido a (4), que Aman =1:AmBa y por lo tanto 
Cxn€ [Am Bn] y [A, Blu< [Am Bm]. Recíprocamente, si DE (Am, 
Bm], para un valor conveniente de à (0<A<1) tenemos AyD = 
=A- AmBw. Tomando en el segmento [A, B] un punto C tal que 
AC=2:AB y comparando (4) con la igualdad AxD=4-AnBw, 
obtenemos D=Cm y, por consiguiente, [Ám, Bm] < (4, B]m que es 
lo que se quería demostrar. 

Veamos cómo pueden calcularse las coordenadas de la proyección 
de un punto dado sobre un hiperplano dado, si se conocen las 
coordenadas del punto y la ecuación del hiperplano, Sea (O, e,, . ..,€,) 
una base de referencia coordenada ortonormal de un espacio unitario, 


sea B un punto de coordenadas fB,, ..., B, y sea 
mE +0 E =0 (1) 
ła ecuación del hiperplano dado. Consideremos dos puntos distintos 
cualesquiera C y D de coordenadas respectivas Y,, ...; Ya Y Ör -» +, Ôn 
que se hallan sobre el hiperplano (11). Tenemos entonces 
TD=(8,—v)+--- + Öna — Pa) en- a2 


Las coordenadas de C y de D deben satisfacer la ecuación (11). 
Introduciéndolas en la ecuación (11) y restando término por término 
las dos igualdades obtenidas, encontramos 


ap) +... +27 (0, — yn) =0. (13) 
De (12) y (13) vemos que la recta 
ia N - aa 


es perpendicular a cualquier vector CD que se halle sobre el plano 
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(11) y, por ende, es perpendicular a este plano. Puesto que la rec- 
ta (14) pasa por el punto B, las igualdades (14) son las ecuaciones 
canónicas de la recta que pasa por el punto dado B de coordenadas 
Br...» Bn y que es perpendicular al plano dado (11). 

Resolviendo conjuntamente las ecuaciones (11) y (14), encontra- 
mos las coordenadas 


y a ll, + 1) 
+an 


ait... Ha 
de la proyección de B sobre el hiperplano (11). 


32.4 Angulo entre un plano y una recta. Consideremos un plano 
arbitrario Ùt k-dimensional perteneciente a un espacio unitario U 
de n dimensiones y una recta cualquiera X de este espacio que 
intercepta el plano M en el punto A. La proyección de la recta X 
sobre el plano WM es una recta Xw que pasa por el punto A. El 
ángulo entre la recta X y su proyección Xy se llama ángulo entre 
la recta X y el plano M (ig. 11). Si la recta X se halla sobre el 

plano WM, se tiene X=Xw y el ángulo 

entre X y M es igual a cero. Si X no se 
halla sobre el plano W, existe el único 
plano (k+ 1} dimensional N que pasa 
por M y ¥. El plano M es un hiperplano 
en el espacio N y por ello se puede 
trazar en N sólo una perpendicular Y 
aM por el punto A. Sea Bun punto 
Fig. ll. cualquiera de X diferente de A y sea C la 
proyección de B sobre W. La recta B V C 

se halla en el espacio N y es perpendicular a W. Todas las per- 
pendiculares a un mismo hiperplano son paralelas (véase el p. 32.3) 
y por esto las rectas Y, X y AVC (véase la fig. 11) se hallan 
Sobre un mismo plano bidimensional. De aqui se deduce que el 
ángulo p entre X y M y el ángulo yy entre È y Y dan en suma 1/2. 

Resta considerar el caso en que el plano k-dimensional M y la 
recta Æ no se intersecan. Tomemos sobre el plano Wi un punto 
cualquiera A. En el espacio U existe, según el p. 30.3, una recta única 
X’ que pasa por el punto A y que es paralela a la recta X. El ángulo 
entre la recta X” y el plano Ñ se llama en este caso ángulo entre 
la recta X y el plano W. Es fácil comprobar que el ángulo entre 
la recta X y el plano M definido de esta forma no depende de cómo 
se escoja el punto auxiliar A. 

Supongamos que en un espacio U se ha fijado una base de re- 
ferencia ortonormal (O, €, ..., €) Y que en esta base de referencia 
están dados un hiperplano WM por medio de la ecuación 


AE nó 2 2 (1) 
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y una recta X mediante sus esuaciones canónicas 


E 
T 


(2) 


Tomemos en el hiperplano M un punto A y sean o, ..., 0, sus 
coordenadas. Entonces las ecuaciones de la recta X’ que es paralela 
a X y que pasa por A son 

> o 
M las ecuaciones de la perpendicular Y levantada en el punto A 
acia el hiperplano W serán 


A (4) 


Por lo visto en el p.32.2, para el ángulo w entre X' y Y se tiene 


a Lati. 
TA 


y, por consiguiente, el ángulo p entre M y X satisface las relaciones 


senp= ladit. -tannal 
Viat a VIRF FF 
(0<o<3). 


Igual que en el espacio euclideo corriente, el ángulo entre una 
recta y un plano en un espacio unitario posee la propiedad de 
extremalidad. 

TEOREMA. Supongamos que en un espacio unitario Ù, de n dimen- 
siones una recta X se corta*con un plano k-dimensional M en un 
punto A formando un ángulo p diferente de O y de 1/2. Entonces 
el ángulo entre X y cualquier recta 8, que pasa en el plano M por 
A y es diferente de la proyección de X sobre M, es mayor que q. 

Tomemos sobre E un punto cualquiera B diferente de A y tra- 
cemos desde B hacia D? una perpendicular indicando su base por C. 
Indiquemos por D la base de la perpendicular trazada desde el 
punto B hacia la recta 3 (véase la fig. 11). Puesto que la recta 
BY C es perpendicular al plano M, los ángulos BCD y BCA son 
rectos. El ángulo BDA es recto por construcción. De los triángulos 
rectángulos BCA, BDA y BCD obtenemos, respectivamente 


senp=50, sen(X, 2)=57 y BD =V BCF DG > BC. 


Luego, seng < sen (X, 3) y p< Z(X, 3) que es lo que se quería 
demostrar 


(5) 
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Ejemplos y problemas 


En los problemas que se ofrecen a continuación se supone que en cada uno 
de los casos se ha escogido y se ha fijado una base de referencia ortonormal 
del espacio puntual euclideo y que los puntos de este espacio se dan por las 
coordenadas calculadas en esta base 

1. Elle la proyección ortogonal del segmento (0, 0, 0, 0) (4, — 1, — 3, 4)) 
sobre el plano M= A, V Aj V Aa V A, de las filas coordenadas de los 
puntos, Ao, An da y As som, respectivamente, (0, 0, 0, 0), (1, 1,1, 1) 
(1,2, 2 —1) y (1,0, 0; 3) 

2. Se lama cia de un punto A a un plano WM el mínimo de las dis- 
tancias entre el punto dado y los puntos de WM. Demuéstrese que esta distancia 


es igual a la longitud del vector APTA. 


3. Hallénse las longitudes de los lados y los ángulos interiores del triángulo 
cupos vértices están dados por las filas coordenadas (2, 4, 2, 4,2), (6, 4, 4,4, 0) 
Y 4, Hällese el ángulo entre la recta Ay V B y el plano As V AL V As, donde 
las filas coordenadas de los puntos Ay, Ay, Ay, y B son iguales, respectivamente, 
a (0, 0,0, 0), (3, 4, —4,—1), 00,1, 1,9 y (2, 2,1. D 


MA ES 
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